深度學(xué)習(xí)并不是AI的未來
現(xiàn)在,每一個(gè)人不是在學(xué)習(xí)深度學(xué)習(xí),就是在準(zhǔn)備開始學(xué)習(xí)深度學(xué)習(xí)的路上。這個(gè)人工智能領(lǐng)域快速火了起來。大約有來自各年齡階段的十萬名學(xué)生在學(xué)習(xí)付費(fèi)或者免費(fèi)的深度學(xué)習(xí)課程。許多初創(chuàng)公司以及產(chǎn)品都打上了該領(lǐng)域的標(biāo)簽,就像流行用語一樣,但是真正使用了深度學(xué)習(xí)的卻很少。大多數(shù)人忽視了一個(gè)事實(shí),深度學(xué)習(xí)只占了機(jī)器學(xué)習(xí)領(lǐng)域的1%,而機(jī)器學(xué)習(xí)又只是人工智能領(lǐng)域的1%。剩下的99%都是大多數(shù)任務(wù)已經(jīng)在實(shí)際使用的。一個(gè)深度學(xué)習(xí)領(lǐng)域?qū)<也⒉皇且粋(gè)人工智能專家。
深度學(xué)習(xí)并不是人工智能的同義詞
最廣為人知的人工智能工具來自于谷歌、Facebook等公司,大都是或者只是深度學(xué)習(xí),所以公眾會(huì)認(rèn)為新的人工智能突破是由或者將由深度學(xué)習(xí)實(shí)現(xiàn)。這是不正確的。像XGBoost這樣的決策樹并不出名,但是在許多Kaggle表格數(shù)據(jù)競賽中默默地打敗了深度學(xué)習(xí)。大眾媒體指出AlphaGo只用到了深度學(xué)習(xí),但是實(shí)際上它是MonteCarlo樹搜索算法+深度學(xué)習(xí),并存在證據(jù)證明單單靠深度學(xué)習(xí)不足以讓它獲勝。許多強(qiáng)化學(xué)習(xí)任務(wù)是由NEAT算法(通過增強(qiáng)拓?fù)涞倪M(jìn)化神經(jīng)網(wǎng)絡(luò))實(shí)現(xiàn),不是基于BP的神經(jīng)網(wǎng)絡(luò)算法。這些都是人工智能領(lǐng)域有關(guān)深度學(xué)習(xí)的誤解。
我并不是說深度學(xué)習(xí)沒有在解決問題:深度學(xué)習(xí)確實(shí)很厲害。樹以及其他算法往往很難打敗深度學(xué)習(xí),有些任務(wù)中深度學(xué)習(xí)也是無法替代的,我也希望未來能開發(fā)出不含深度學(xué)習(xí)的系統(tǒng)能打敗深度學(xué)習(xí)。或許也能夠解決深度學(xué)習(xí)作出的決策存在的法律噩夢(即使是正確的,但是被法律質(zhì)疑時(shí)無法解釋)。同時(shí)我想在新聞里讀到像災(zāi)難性遺忘(出現(xiàn)學(xué)習(xí)新的信息前突然忘記先前學(xué)習(xí)的信息的傾向)這樣的有關(guān)深度學(xué)習(xí)的事情,或者讀到解決過擬合問題的一些日常新聞。關(guān)于智能:深度學(xué)習(xí)僅僅相信得到的訓(xùn)練數(shù)據(jù),并不理解對與錯(cuò)、現(xiàn)實(shí)與虛幻、是否公平。在某種程度上,人類有時(shí)也會(huì)相信假新聞,甚至小孩子也知道電影是虛構(gòu)的,并不現(xiàn)實(shí)。
現(xiàn)在的深度學(xué)習(xí)也許是曾經(jīng)的HTML?
20年前每個(gè)人都在學(xué)習(xí)HTML,這種編寫網(wǎng)頁的標(biāo)記語言,那時(shí)每個(gè)人都幻想成為一個(gè)。com億萬富翁。就像其他人一樣,我學(xué)習(xí)了每一種看似很有用的技術(shù):HTML、移動(dòng)端應(yīng)用、深度學(xué)習(xí),我也希望每一個(gè)人在其一生中能夠不斷學(xué)習(xí)新事物。事實(shí)上,你不可能一輩子只學(xué)一種技術(shù)。如果你學(xué)習(xí)深度學(xué)習(xí),你可能一輩子都搞不懂AI。來自1995年的HTML已經(jīng)過時(shí)且無法滿足需求,它被CSS、Javascript以及服務(wù)器端編程語言所接管。同理,深度學(xué)習(xí)總有一天也會(huì)過時(shí)且不夠用。許多流行的移動(dòng)端APP都不包含HTML,所以誰知道未來的人工智能APP是否包含深度學(xué)習(xí)呢?
事實(shí)上,庫卡機(jī)器人,深度學(xué)習(xí)是一種源于1980年代的技術(shù),比HTML還悠久:70年代,帶有隱藏層的神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練更多數(shù)據(jù)獲得了更好的結(jié)果,隨后重命名為深度學(xué)習(xí)并開始大肆宣傳。在1992年,我仔細(xì)檢查了一些神經(jīng)網(wǎng)絡(luò)源碼以及一些分形、元胞自動(dòng)機(jī)之類的東西。就像大多數(shù)人,那時(shí)的我誤以為深度學(xué)習(xí)只是一個(gè)學(xué)術(shù)性數(shù)學(xué)難題,沒有實(shí)際用途。相反,我專注于學(xué)習(xí)給出直接結(jié)果的技術(shù):電子游戲的3D技術(shù)、互聯(lián)網(wǎng)等等。但是我們都錯(cuò)了,深度學(xué)習(xí)能夠利用大數(shù)據(jù)做很多神奇的事情!2015年我著迷于DeepDream(人工神經(jīng)網(wǎng)絡(luò)),接下來是GANs(生成對抗網(wǎng)絡(luò))等等。當(dāng)然,深度學(xué)習(xí)并不是我們發(fā)明的最后的完美的AI科學(xué)。
在過去的幾十年里,古老的深度學(xué)習(xí)已經(jīng)被廣泛研究和更新并應(yīng)用于更精確地解決更多任務(wù),不過沒有一個(gè)版本的深度學(xué)習(xí)(Convolutional,RNN,RNN+LSTM,GANs等)能夠解釋它的決策。在未來,深度學(xué)習(xí)能夠解決更多任務(wù)并取代一些工作,但不可能解決所有的問題,或者保持驚人的進(jìn)步以自我解決黑箱問題。
哲學(xué)家柏拉圖與亞里士多德正在說:深度學(xué)習(xí)可不能理解他們。
未來人工智能應(yīng)該去探索一些其他的新方法或已存在被忽略的方法。深度學(xué)習(xí)的限制在于僅僅認(rèn)為真理是數(shù)據(jù)中頻繁出現(xiàn)的地方,而統(tǒng)計(jì)較少的就是錯(cuò)的或者頻繁出現(xiàn)地方的對立面。深度學(xué)習(xí)的公正性并不來自于它本身,而是來自于人類選擇并準(zhǔn)備的數(shù)據(jù)。深度學(xué)習(xí)不是用人類的方法來閱讀文本并翻譯出字里行間的意思。
難怪深度學(xué)習(xí)并不能解釋自己的決策,深度學(xué)習(xí)會(huì)學(xué)習(xí)并模仿有缺陷的邏輯而不是去發(fā)現(xiàn)缺陷,包括恐怖主義。就連小孩都能自己理解電影中誰是壞蛋,但是深度學(xué)習(xí)不能,除非人類一開始就非常明確地告訴它。深度學(xué)習(xí)中一些特定的東西,比如基于梯度下降的反向傳播算法、自定義深度學(xué)習(xí)硬件是很酷的,但是那大多數(shù)都是統(tǒng)計(jì)學(xué)和幾何學(xué),所以將不會(huì)出現(xiàn)在2037年的AI領(lǐng)域。
深度學(xué)習(xí)領(lǐng)域的人工智能或?qū)⑹欠欠ǖ?/p>
對于大多數(shù)任務(wù)而言,深度學(xué)習(xí)領(lǐng)域的人工智能是或?qū)⑹欠欠ǖ模皇欠弦?guī)則的。收集28個(gè)歐盟國家的居民數(shù)據(jù)的人或公司應(yīng)該遵循建立于2018年5月25日的《通用數(shù)據(jù)保護(hù)法規(guī)(GDPR)》。在這一天,歐洲的大多數(shù)APP將去除深度學(xué)習(xí),導(dǎo)致許多人工智能初創(chuàng)公司快速將深度學(xué)習(xí)替換成其他的東西,否則將面臨罰款。罰款金將高達(dá)全球收入的4%,包括在美國的收入。
GDPR要求針對自動(dòng)決策作出正確的解釋,防止由于種族、意見、健康等等歧視而產(chǎn)生不好的影響。全球范圍內(nèi),像GDPR這樣的法律出現(xiàn)或者在計(jì)劃內(nèi)只是時(shí)間問題。《美國公平信貸報(bào)告法》要求披露所有影響消費(fèi)者信用評分的因素,最多允許4個(gè)因素。深度學(xué)習(xí)的影響因素常常有上千或者百萬級,不僅僅只有4個(gè),如何簡化為4個(gè)?人工智能,比如比特幣ICO,開始忽視規(guī)則,只不過法律和罰款總會(huì)來的。
深度學(xué)習(xí)系統(tǒng)在辨別小貓照片或者在自拍時(shí)添加小兔耳朵特效時(shí)都需要更多相關(guān)的決策,在未來將被非深度學(xué)習(xí)系統(tǒng)所替代。人工智能需要可解釋的,與深度學(xué)習(xí)大大不同,你能用簡單、合法的詞語向法官或者普通使用者解釋結(jié)果。深度學(xué)習(xí)的復(fù)雜性,使得它對于法官和用戶來說就是一種魔法,具有法律風(fēng)險(xiǎn):并不是很酷炫的未來。深度學(xué)習(xí)會(huì)建議或者警示人類,比如從醫(yī)學(xué)圖像中檢測疾病,由醫(yī)生核實(shí),但是這只是半自動(dòng)化,缺少細(xì)節(jié)。而對被AI拒絕(拒絕貸款、工作等等)需要解釋用戶說點(diǎn)什么呢?
法律包括了解釋權(quán),比如為什么工作或者貸款被拒絕了。深度學(xué)習(xí)給出的結(jié)果,不是自然(法律)語言能解釋的。你可以得到數(shù)頁有關(guān)深度學(xué)習(xí)的變量的內(nèi)容,但是法官或用戶不能接受,因?yàn)榧词故亲詈玫臄?shù)學(xué)家或者其他算法也不能將深度學(xué)習(xí)的模型用詞語簡單解釋。




