AI成精?谷歌AI機(jī)器人的背后
發(fā)布時(shí)間:2018-07-02 來源: 日記大全 點(diǎn)擊:
AI訂餐 一場機(jī)器與人類的真實(shí)對話
電話訂餐,相信很多吃貨們都使用過。不過大家可能沒有想過使用機(jī)器人來向商家訂餐,因?yàn)殡m然只是簡單的對話,但是在對話過程中需要向商家確定諸如就餐時(shí)間、人數(shù)、包間等信息。另外還可能有許多“意外”發(fā)生,比如餐館預(yù)約人數(shù)太多,就需要臨時(shí)改變計(jì)劃,經(jīng)雙方協(xié)作溝通才能最終順利完成訂單。這些對于人類來說可能非常簡單,但如果全程是由機(jī)器人來完成的,我們就不得不驚嘆機(jī)器人的智慧了。谷歌的AI訂餐視頻展示中,AI機(jī)器人就通過語音電話和實(shí)體餐廳完成了訂餐活動(dòng),而且商家根本沒有察覺是在和機(jī)器人對話(圖1)。
AI訂餐的背后——自然語言處理技術(shù)
很多人意識(shí)不到一次簡單的訂餐活動(dòng)對AI來說有多大難度。因?yàn)樵趯υ掃^程中,AI機(jī)器人需要理解、思考人類的回話,并作出得體的回復(fù),這意味著機(jī)器人能夠完全讀懂并處理人類的自然語言。谷歌AI機(jī)器人是怎樣擁有這些“超能力”的呢?
一方面要讓AI可以“聽”懂人類的對話,就需要讓機(jī)器人熟悉人類的對話場景。谷歌科技人員準(zhǔn)備了海量的對話場景,并通過這些場景對機(jī)器人進(jìn)行訓(xùn)練(上述訂餐的例子中,谷歌就將我們常用的訂餐對話輸入到機(jī)器人的數(shù)據(jù)庫中進(jìn)行訓(xùn)練)。通過海量的數(shù)據(jù)訓(xùn)練后,AI機(jī)器人基本熟悉人類某個(gè)場景的對話,就知道該怎么與對方進(jìn)行交流,從而可以在接收對方的回復(fù)后選擇合適的語句進(jìn)行回復(fù)。
另一方面借助AI強(qiáng)大的自我學(xué)習(xí)能力,它可以在海量數(shù)據(jù)訓(xùn)練后實(shí)現(xiàn)自我學(xué)習(xí)和提高。在谷歌展示的訂餐視頻中,AI機(jī)器人在整個(gè)對話中語氣非常自然,包括停頓、縮略語,甚至?xí)诨貜?fù)中增加一些看似“無用”的口語性語氣助詞“Mmhmm”、“uh”等,這些語氣助詞的出現(xiàn)非常自然。這是AI典型的自我學(xué)習(xí)能力,這種逼真的模擬場景讓對方根本不知道是在和機(jī)器人對話(圖2)。
為了讓機(jī)器人的發(fā)音顯得更加自然、逼真,谷歌借助強(qiáng)大的TTS引擎技術(shù),不僅可以使AI機(jī)器人的語音和人類的語音非常類似,還可以根據(jù)不同的情境控制語音的語調(diào),這樣使得AI的發(fā)音、語氣、語境水平和真正的人類相差無幾。在上述訂餐視頻中出鏡的就是谷歌智能助理Google Assistant,它成功地“騙”過人類,完成了一項(xiàng)人工電話訂餐(圖3)。
AI機(jī)器人成功訂餐視頻,展示的實(shí)際上是谷歌在自然語言處理方面的技術(shù)積累。谷歌賦予了AI機(jī)器人進(jìn)行多輪自然對話的能力,也是通過這種多輪對話能力的延伸,谷歌聯(lián)合使用了一個(gè)級聯(lián)TTS引擎和一個(gè)生成式TTS引擎,來根據(jù)不同的情境控制語音的語調(diào),讓AI機(jī)器人的語音對話達(dá)到了和真正的人類相比都難以區(qū)分的地步。
當(dāng)然類似人工智能的應(yīng)用,同樣出現(xiàn)在谷歌的其他產(chǎn)品中。我們常用的Gmail新增了一種全新的智能回復(fù)功能——Smart Compose,通過機(jī)器學(xué)習(xí)理解一封郵件的上下文,這樣在你寫郵件時(shí)都不用將一個(gè)句子寫完,機(jī)器學(xué)習(xí)就能通過理解幫你補(bǔ)全你想說的話,實(shí)現(xiàn)非常智能的回復(fù)(圖4)。
AI智能 還可以帶給我們更多好處
從上述介紹可以看到,AI不僅可以理解人類的對話,而且可以根據(jù)人們的需要智能協(xié)助完成很多的工作。將上述AI訂餐機(jī)器人的技術(shù)應(yīng)用到大型超市、熱門景區(qū)等場所的前臺(tái),就可以完全實(shí)現(xiàn)無人化操作,甚至可以提供比人工客服更好的導(dǎo)游服務(wù)。
一些APP上的人工智能,比如 Google Photos,可以幫你一鍵分享照片給同框入鏡的好友,這樣一起出游的朋友在完成合影照片上傳后,同框好友就會(huì)自動(dòng)收到合影照片。再如Google Map運(yùn)用圖像識(shí)別實(shí)景導(dǎo)航,這樣在手機(jī)上使用谷歌地圖導(dǎo)航時(shí),前面商店、餐館、加油站的信息會(huì)自動(dòng)顯示出來,成為一個(gè)非常智能的導(dǎo)航專家(圖5)。
當(dāng)然AI應(yīng)用場景還會(huì)出現(xiàn)在我們生活的方方面面。在手機(jī)上練習(xí)英語口語,每讀一句話,AI會(huì)給你打分;當(dāng)你洋洋灑灑寫完一篇作文,AI會(huì)圈出作文中出現(xiàn)的多詞、缺詞、錯(cuò)詞和次序錯(cuò)誤等……總之,隨著AI技術(shù)的發(fā)展,它必定會(huì)給我們的生活帶來各種意想不到的便利(圖6)。
熱點(diǎn)文章閱讀