12月14日的谷歌開(kāi)發(fā)者大會(huì)上,最激動(dòng)人心的消息應(yīng)該就是谷歌AI中國(guó)中心的成立了。身著紅衣的李飛飛無(wú)疑是谷歌開(kāi)發(fā)者大會(huì)最大的主角,她在現(xiàn)場(chǎng)宣布:谷歌AI中國(guó)中心將由她和GoogleCloud研發(fā)負(fù)責(zé)人李佳博士共同領(lǐng)導(dǎo),激蕩起了現(xiàn)場(chǎng)一片掌聲。
李飛飛從洗衣工到斯坦福教授的傳奇經(jīng)歷被傳遍全國(guó),不得不讓人感嘆,我們又回到了崇拜科學(xué)家的時(shí)代。
或許是因?yàn)槿斯ぶ悄鼙旧砭褪且粋(gè)學(xué)術(shù)話語(yǔ)權(quán)極強(qiáng)的領(lǐng)域,現(xiàn)在的AI企業(yè)不管體量大小,總要請(qǐng)來(lái)幾個(gè)教授、專家坐鎮(zhèn),時(shí)不時(shí)還要發(fā)篇論文,刷刷CVPR等等競(jìng)賽的排名。
可問(wèn)題的關(guān)鍵是,我們崇拜科學(xué)家,不僅僅是因?yàn)榭茖W(xué)家有非凡的學(xué)術(shù)能力,還因?yàn)樗麄兪前讶斯ぶ悄芗夹g(shù)從論文中帶到我們身邊的傳火者。
科學(xué)家常有,而傳火者不常有。今天就來(lái)談?wù)劊鯓硬拍芊Q得上人工智能領(lǐng)域的傳火者。
論文產(chǎn)品化:象牙塔內(nèi)外的海水與火焰
在很多人的概念里都存有一個(gè)誤區(qū),論文發(fā)的多、專利申請(qǐng)的多、競(jìng)賽排名足夠高就意味著技術(shù)有著更高的實(shí)用性和商業(yè)前景?蓪(shí)際上從論文到產(chǎn)品,再到優(yōu)秀的產(chǎn)品,之間里程往往比我們想象中要遙遠(yuǎn)。
不管是論文還是賽事,往往都會(huì)給出一個(gè)理想的恒定實(shí)驗(yàn)環(huán)境來(lái)追求某一項(xiàng)技術(shù)的極致可能。比如給出統(tǒng)一的硬件標(biāo)準(zhǔn)或數(shù)據(jù)庫(kù),庫(kù)卡機(jī)器人何服電機(jī)維修,而得出的結(jié)果也是在某一標(biāo)準(zhǔn)下的最佳結(jié)果。
這就導(dǎo)致一種尷尬的結(jié)果:很多時(shí)候論文走向一種非常刁鉆的方向,很難實(shí)際應(yīng)用在生活中。像是耗費(fèi)大量計(jì)算資源去追求極小的模型壓縮,或是犧牲計(jì)算速度去在極小范圍內(nèi)提升模型準(zhǔn)確率。但這些研究成果往往只能在仿真環(huán)境中起作用,要想應(yīng)用到現(xiàn)實(shí)中來(lái),往往會(huì)遇到這樣那樣的問(wèn)題。
現(xiàn)在很多技術(shù)模型都是開(kāi)源共享的,將公開(kāi)的模型進(jìn)行參數(shù)調(diào)試,從一個(gè)領(lǐng)域移植到另一領(lǐng)域并不難,可想要實(shí)現(xiàn)產(chǎn)品化,就要為模型尋找到合適場(chǎng)景,嵌入到適用的軟件或硬件中。在這一過(guò)程中,如何面對(duì)技術(shù)開(kāi)源,難以建立壁壘的問(wèn)題就是一個(gè)難點(diǎn)。應(yīng)用成本越來(lái)越低的人臉識(shí)別,就是技術(shù)無(wú)壁壘、產(chǎn)品想象力匱乏形成的結(jié)果。
即使把技術(shù)成功產(chǎn)品化,也要考量產(chǎn)品的實(shí)際應(yīng)用性。人工智能技術(shù)的加入是不是真的能提升用戶體驗(yàn),體驗(yàn)的提升和所耗費(fèi)的成本之間是否又能找到平衡點(diǎn)很多時(shí)候人工智能產(chǎn)品還未經(jīng)市場(chǎng)檢驗(yàn),就已經(jīng)在折戟在論文產(chǎn)品化的過(guò)程中了。
論文和排名僅僅是人工智能產(chǎn)業(yè)的一小部分,有一些企業(yè)靠這些可以拿到大筆融資,但這絕不僅僅是成功的標(biāo)志。專家教授一臉意氣風(fēng)發(fā),可背后的投資人還雙目灼灼的盼著論文變現(xiàn)呢。到最后往往在學(xué)界和業(yè)界成了兩個(gè)極端,一邊歌舞升平的寫著論文開(kāi)著會(huì),另一邊則為了優(yōu)化產(chǎn)品急成了熱鍋上的螞蟻。
總之,論文和會(huì)議競(jìng)賽中的技術(shù)存在于仿真世界中,代表的是人工智能無(wú)限的可能性。而如今科學(xué)家們紛紛走出象牙塔,我們希望看到的是他們把技術(shù)從仿真世界帶到物理世界,向我們展示人工智能的應(yīng)用性。
把目光投向物理世界,學(xué)術(shù)力量落足在哪?
在今天的人工智能熱潮中,既然有人靠水論文拿融資,自然也會(huì)有人可以成為技術(shù)的傳火者,把學(xué)術(shù)能力化為產(chǎn)品能力甚至商業(yè)能力。下面就分別介紹一下自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)和強(qiáng)化學(xué)習(xí)三個(gè)領(lǐng)域中的傳火者。
幫谷歌AI連接中國(guó)的李飛飛
拋開(kāi)谷歌的光環(huán),從加州理工畢業(yè)的李飛飛自身也有著極高的學(xué)術(shù)起點(diǎn),在斯坦福實(shí)驗(yàn)室中的身體力行培養(yǎng)出了不少牛人,也憑著TED上強(qiáng)大的演講能力吸引了不少人關(guān)注計(jì)算機(jī)視覺(jué)領(lǐng)域。
李飛飛對(duì)人工智能產(chǎn)業(yè)最大的貢獻(xiàn)無(wú)疑是創(chuàng)立了世界上最大的圖片識(shí)別數(shù)據(jù)庫(kù)ImageNet。此前機(jī)器學(xué)習(xí)一直飽受過(guò)擬合和泛化的困擾,學(xué)界一直試圖在模型上尋找解決方式,直到李飛飛開(kāi)始主導(dǎo)ImageNet的研究,從數(shù)據(jù)集入手試圖改變游戲規(guī)則。
ImageNet的影響力越來(lái)越大,甚至從中誕生了卷積神經(jīng)網(wǎng)絡(luò)這樣實(shí)用性極高的技術(shù),計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)也越來(lái)越多的應(yīng)用在物理世界中:社交網(wǎng)絡(luò)的圖像標(biāo)注、自動(dòng)駕駛的物體監(jiān)測(cè)大量的落地應(yīng)用也再不斷的向CV技術(shù)提供反饋,物理世界的技術(shù)應(yīng)用也催化了仿真世界中技術(shù)的發(fā)展。
教機(jī)器人疊毛巾的PieterAbbeel
提到強(qiáng)化學(xué)習(xí),m.dekuna.com,大多數(shù)人會(huì)認(rèn)為這是一項(xiàng)距離現(xiàn)實(shí)非常遙遠(yuǎn)的技術(shù),不過(guò)一直有人在嘗試著把這一技術(shù)帶到現(xiàn)實(shí),Pieterabbeel就是其中之一。
在博士時(shí)期,PieterAbbeel就與吳恩達(dá)一同提出了師徒學(xué)習(xí)這一強(qiáng)化學(xué)習(xí)中的重要概念。在伯克利任教期間,還因讓機(jī)器人通過(guò)強(qiáng)化學(xué)習(xí)學(xué)會(huì)疊毛巾獲得了MIT頒發(fā)的TR35獎(jiǎng)項(xiàng)。后來(lái)入職馬斯克的OpenAI,還推出了著名的機(jī)器人訓(xùn)練場(chǎng)Gym,讓很多團(tuán)隊(duì)可以在低成本的前提下快速訓(xùn)練智能體。
直到今天,硅谷機(jī)器人制造商WillowGarage的很多產(chǎn)品中還有PieterAbbeel利用強(qiáng)化學(xué)習(xí)訓(xùn)練的成果。如今PieterAbbeel已經(jīng)離開(kāi)OpenAI,創(chuàng)立自己的團(tuán)隊(duì),專注于利用強(qiáng)化學(xué)習(xí)讓現(xiàn)有硬件設(shè)備自主學(xué)習(xí)完成任務(wù)。
自動(dòng)化的普及度不斷增高的過(guò)程,本質(zhì)上也是機(jī)器人訓(xùn)練成本不斷降低的過(guò)程,強(qiáng)化學(xué)習(xí)的應(yīng)用的落足之處也在其中。
為百度布局深度學(xué)習(xí)的王海峰
NLP和CV兩個(gè)領(lǐng)域,都聚集了大量華人科學(xué)家。在學(xué)界和產(chǎn)業(yè)界都有布局的,不光有李飛飛,王海峰也是其中一個(gè)典型。
王海峰在學(xué)界的成就很多,比如在16年當(dāng)選了國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)(TheAssociationforComputationalLinguistics)的會(huì)士。在這個(gè)于影響力、權(quán)威性和活躍度兼?zhèn)涞膶W(xué)術(shù)組織中,王海峰成了是大陸首位、也是最年輕的一位ACL院士。
2010年入職百度后,王海峰也在百度獲得了很大的發(fā)揮空間,接連布局了自然語(yǔ)言處理、互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)、圖片搜索和語(yǔ)音技術(shù)等等多個(gè)部門。在2013年協(xié)助創(chuàng)立百度深度學(xué)習(xí)研究院后,很快我們就看到了百度翻譯、語(yǔ)音搜索等等產(chǎn)品上的變化。
在這些用戶體驗(yàn)的感受差異中,體現(xiàn)的是神經(jīng)網(wǎng)絡(luò)、語(yǔ)音識(shí)別和知識(shí)圖譜等等技術(shù)的理性呈現(xiàn)。
革命來(lái)臨前夜,天秤兩端的學(xué)與業(yè)
以上三位科學(xué)家僅僅是人工智能領(lǐng)域眾多傳火者的代表人物,卻也能管中窺豹,領(lǐng)悟到一點(diǎn)人工智能產(chǎn)業(yè)發(fā)展的勢(shì)頭。
有一些生物學(xué)界的人士曾經(jīng)對(duì)這次人工智能浪潮做出過(guò)忠告,說(shuō)今天的人工智能特別像十幾年前的生物學(xué),論文滿天飛、大學(xué)猛開(kāi)專業(yè)、專家教授紛紛下海創(chuàng)業(yè)。最后生物學(xué)卻因?yàn)楫a(chǎn)業(yè)化能力不足,湮滅了學(xué)術(shù)界的星星火光。而人工智能被稱為下一次工業(yè)革命,自然要把學(xué)和業(yè)放在天秤的兩端。
學(xué)的能力,既包括了論文數(shù)量、競(jìng)賽排名,也需要考量技術(shù)的創(chuàng)新型和實(shí)用性。
像現(xiàn)如今大火的DeepMind,他們發(fā)表的很多關(guān)于深度學(xué)習(xí)的論文中并沒(méi)有利用太多超前的方法論,而是引源上個(gè)世紀(jì)的認(rèn)知科學(xué)方法,用來(lái)解決今天的現(xiàn)實(shí)問(wèn)題。




