早在2015年,聊天機(jī)器人就備受關(guān)注。其中一個被大肆宣傳的是Facebook的M,它的目標(biāo)是成為一個靈活的、適用廣泛的機(jī)器人,它可以做很多不同的事情,比如購買物品、安排送禮、預(yù)定餐廳和計劃旅行。但這些聲音遠(yuǎn)遠(yuǎn)超過了機(jī)器人本身。當(dāng)Facebook在灣區(qū)對2500人測試M時,該軟件并未能完成要求它完成的大部分任務(wù)。
在對M和其他聊天機(jī)器人的熱情爆發(fā)之后,KUKA機(jī)器人示教器維修,隨之而來的是一波失望(微軟首席執(zhí)行官納德拉曾說“機(jī)器人是新的應(yīng)用”)。聊天機(jī)器人不像機(jī)器人那么愛聊天,那是因?yàn)樗麄儽挥?xùn)練只談?wù)撘恍〔糠质虑椋瑘?zhí)行特定的、有限的任務(wù)。它們無法與人進(jìn)行自然的對話,無法根據(jù)對單詞及其含義的一般理解產(chǎn)生自己的反應(yīng)。它們只能提供一般性的答復(fù)。
在M測試版之前,F(xiàn)acebook縮減了對這款機(jī)器人的宏偉計劃,盡管它的一些自然語言技術(shù)已經(jīng)進(jìn)入了相對保守的Messenger聊天機(jī)器人領(lǐng)域,這些聊天機(jī)器人可以做一些簡單的事情,比如點(diǎn)餐或發(fā)送問答信息。美國運(yùn)通和1-800-FLOWERS等公司仍然使用這種簡單的聊天機(jī)器人來回答客戶服務(wù)問題、接受基本訂單和提供賬戶余額。如果你問一些超出它們理解范圍的問題,則會讓你和人工客服聯(lián)系。
但Facebook的人工智能研究小組已經(jīng)從那種只能簡單聊天的機(jī)器人發(fā)展起來。Facebook自然語言研究人員Antoine Bordes表示:“過去3到4年我們一直在說,對目標(biāo)導(dǎo)向?qū)υ挼难芯坎皇俏覀冃枰剿鞯牡缆罚驗(yàn)樗y,風(fēng)險太大。”他還表示,如果一個旅游聊天機(jī)器人預(yù)訂了“錯誤的飛機(jī)、錯誤的航班,那在金錢、旅游等方面都是一個很大的錯誤。”
Bordes解釋說,F(xiàn)acebook并沒有專注于特定任務(wù)的機(jī)制,而是后退一步來解決一個更深層次的問題——教虛擬代理像人一樣交談。他們認(rèn)為,如果聊天機(jī)器人能夠更好地理解,并與人類交流,它們最終可能會成為更好的助手,幫助人們完成實(shí)際任務(wù),比如預(yù)訂機(jī)票。
Facebook在這方面投入了大量資金,聘請了自然語言人工智能領(lǐng)域的一些頂尖人才。該公司喜歡表明的是,與一些大型科技公司不同,它通過將人工智能研究成果發(fā)布到網(wǎng)上,讓整個研究社區(qū)都能看到,這可能會幫助其他正在構(gòu)建下一代人工智能的公司。但這項(xiàng)研究肯定也會在自己的產(chǎn)品中體現(xiàn)。
消息應(yīng)用與人們的日常生活深度捆綁,包括Messenger和WhatsApp,后者也是Facebook的子公司,目前仍在研究如何盈利。隨著首席執(zhí)行官扎克伯格為公司提出一個更加重視私人對話的新愿景,Messenger和WhatsApp將需要增加一些功能,以保持相對于微信、Telegram和蘋果iMessage等其他信息平臺的領(lǐng)先地位。
構(gòu)建一種可以隨意與人聊天的算法,已經(jīng)成為大型科技公司的一個關(guān)鍵目標(biāo)。亞馬遜、谷歌和微軟都加入了Facebook的行列,押注于人類對話的力量——不僅是基于文本的消息應(yīng)用,還包括語音助手和其他體驗(yàn)。由于最近的研究進(jìn)展,通往真正的對話式計算機(jī)的道路突然變得清晰起來,但首先到達(dá)目的地的獎品仍有待商榷。
換句話說,F(xiàn)acebook的自然語言研究遠(yuǎn)不止是復(fù)活M或者改進(jìn)基于Messenger的聊天機(jī)器人,而是事關(guān)整個公司的未來。神經(jīng)網(wǎng)絡(luò)
構(gòu)建一個能與人進(jìn)行逼真對話的數(shù)字代理人,可以說是所有自然語言問題中最難的。它需要一臺機(jī)器來學(xué)習(xí)一本充滿單詞的字典,以及所有的用法和細(xì)微差別,然后在與一個無法預(yù)測的人的實(shí)時對話中使用它們。
直到最近幾年,自然語言的AI社區(qū)才開始向通用知識機(jī)器人邁出更大的步伐。這部分是因?yàn)樯窠?jīng)網(wǎng)絡(luò)的巨大進(jìn)步,這是一種機(jī)器學(xué)習(xí)算法,通過分析大量數(shù)據(jù)來識別模式。
在AI發(fā)展的大部分歷史中,人類一直在觀察軟件在機(jī)器學(xué)習(xí)過程中的表現(xiàn)。在一種被稱為監(jiān)督學(xué)習(xí)的技術(shù)中,人類教師通過提供一個問題的正確答案來慢慢訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后調(diào)整算法使其達(dá)到相同的解決方案。
當(dāng)有大量的數(shù)據(jù)都是經(jīng)過精心標(biāo)注的時候,監(jiān)督學(xué)習(xí)就能很好地工作——比如,通過識別照片中有貓、狗或其他物品。但這種方法在聊天機(jī)器人的世界里往往行不通。數(shù)千小時的人與人之間的對話記錄很難大量找到,而且對于一家公司來說,創(chuàng)建這些記錄的成本很高。
由于很難教聊天機(jī)器人使用這些較老的方法進(jìn)行對話,研究人員一直在尋找替代監(jiān)督學(xué)習(xí)的方法,讓神經(jīng)網(wǎng)絡(luò)在沒有人參與的情況下自己從數(shù)據(jù)中學(xué)習(xí)。
減少對訓(xùn)練數(shù)據(jù)需求的一種方法是教機(jī)器基本常識。如果一臺計算機(jī)對世界有一些了解,比如物體的相對大小、人們?nèi)绾问褂盟鼈儯约耙恍┪锢矶扇绾斡绊懰鼈兊闹R,那么它可能會將選擇范圍縮小。
人類這樣做很自然。例如,假設(shè)你在一個陡峭的懸崖邊開車,突然看到前面的路上有一塊大石頭,你要避免撞到石頭。但在考慮你的選擇時,你永遠(yuǎn)不會決定突然向懸崖邊艱難地轉(zhuǎn)彎。你知道,由于重力的作用,汽車會猛烈地落在下面的巖石上。
“我們所做的大部分學(xué)習(xí)是觀察世界,”Facebook副總裁兼首席人工智能科學(xué)家Yann Lecun是人工智能領(lǐng)域的傳奇人物,自上世紀(jì)80年代以來一直在應(yīng)對最大的挑戰(zhàn),他表示:“我們從父母和其他人身上學(xué)到了很多東西,但我們也正是通過與世界互動,通過嘗試、失敗和改正,學(xué)到了很多東西。”
使用這種技術(shù)訓(xùn)練的人工智能,稱為無監(jiān)督學(xué)習(xí),工作原理是一樣的。例如,一輛自動駕駛汽車通過它的許多傳感器和攝像頭收集有關(guān)世界的數(shù)據(jù),就像一個孩子通過她的五種感官了解世界一樣。通過這種方法,科學(xué)家們?yōu)闄C(jī)器提供了大量的訓(xùn)練數(shù)據(jù)供其仔細(xì)研究。他們不會要求它給出正確的答案,也不會哄它朝著某個目標(biāo)前進(jìn)。相反,他們只要求IT部門處理數(shù)據(jù)并從中學(xué)習(xí),找到模式,并映射不同數(shù)據(jù)點(diǎn)之間的關(guān)系。
在許多情況下,這些必要的數(shù)據(jù)很難獲得。但是AI的一個領(lǐng)域是,神經(jīng)網(wǎng)絡(luò)可以在不需要傳感器的情況下了解世界,即自然語言處理。研究人員可以使用大量現(xiàn)有的文本來幫助算法理解人類世界,這是理解語言的必要部分。
假設(shè)給一個神經(jīng)網(wǎng)絡(luò)兩個短語來理解:“獎杯放不進(jìn)手提箱,因?yàn)樗罅恕?rdquo;
“獎杯放不進(jìn)手提箱,因?yàn)樗×恕?rdquo;




