《自然》雜志日前撰文稱(chēng),由于人工智能技術(shù)模擬了人腦的工作模式,而沒(méi)有采用明確的數(shù)據(jù)存儲(chǔ)和分析方式,因此存在一些難以捉摸的黑盒子。如何解決這些“黑盒子”問(wèn)題,從而真正了解機(jī)器的學(xué)習(xí)方式便成為擺在科學(xué)家面前的嚴(yán)峻挑戰(zhàn)。
?
所謂“黑盒子”,是指從用戶(hù)的觀點(diǎn)來(lái)看一個(gè)器件或產(chǎn)品時(shí),并不關(guān)心其內(nèi)部構(gòu)造和原理,而只關(guān)心它的功能及如何使用這些功能。但從研究者的角度講,搞清楚內(nèi)部構(gòu)造和原理是必須的。
?
迪恩?鮑莫里奧(Dean Pomerleau)至今還記得他第一次碰到黑盒子問(wèn)題時(shí)的情形。那是1991年,他當(dāng)時(shí)正在開(kāi)創(chuàng)一項(xiàng)如今在無(wú)人駕駛汽車(chē)領(lǐng)域早已隨處可見(jiàn)的技術(shù):教電腦開(kāi)車(chē)。
?
這意味著要在一臺(tái)軍用悍馬上安裝一些特殊裝備,并控制其在城市道路上行駛。當(dāng)時(shí)的鮑莫里奧還是卡內(nèi)基梅隆大學(xué)機(jī)器人專(zhuān)業(yè)的一名研究生。
?
那輛悍馬上安裝了一臺(tái)電腦,可以通過(guò)對(duì)攝像頭編程來(lái)解讀路況,然后記住他針對(duì)各類(lèi)情況采取的每個(gè)動(dòng)作。鮑莫里奧希望這臺(tái)機(jī)器最終能夠通過(guò)這種方法學(xué)會(huì)自己開(kāi)車(chē)。
?
鮑莫里奧會(huì)在駕車(chē)過(guò)程中為系統(tǒng)提供幾分鐘的訓(xùn)練,然后讓它自行練習(xí)。一切似乎進(jìn)展順利——直到有一天,那輛悍馬在靠近一座橋時(shí)突然轉(zhuǎn)向一側(cè)。幸虧他及時(shí)抓住方向盤(pán),才避免了事故的發(fā)生。
?
回到實(shí)驗(yàn)室后,鮑莫里奧開(kāi)始著手研究電腦的問(wèn)題所在。“我的觀點(diǎn)是要打開(kāi)黑盒子,搞清楚它在想什么。”他解釋道。但現(xiàn)在呢?他已經(jīng)通過(guò)編程讓電腦扮演了“神經(jīng)網(wǎng)絡(luò)”的角色——這是一種模擬人腦結(jié)構(gòu)的人工智能技術(shù),而且號(hào)稱(chēng)比傳統(tǒng)算法更善于應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)環(huán)境。
?
不幸的是,這類(lèi)網(wǎng)絡(luò)就像人腦一樣捉摸不透。他們并沒(méi)有把自己學(xué)到的知識(shí)明確地存儲(chǔ)在數(shù)字存儲(chǔ)器的某個(gè)位置,而是把信息分散開(kāi)來(lái),使得研究人員難以解讀。直到對(duì)自己的軟件在面對(duì)各種刺激時(shí)的表現(xiàn)展開(kāi)了全面測(cè)試后,鮑莫里奧才發(fā)現(xiàn)了問(wèn)題的根源:這套神經(jīng)網(wǎng)絡(luò)程序?qū)㈤L(zhǎng)滿(mǎn)草的路肩當(dāng)成方向指引標(biāo)志,所以橋梁的出現(xiàn)才令它感到困惑。
?
25年后,解密黑盒子的難度急劇增加,也更加緊迫。人工智能技術(shù)本身在復(fù)雜程度和應(yīng)用場(chǎng)景上也實(shí)現(xiàn)了爆發(fā)。
?
鮑莫里奧如今在卡內(nèi)基梅隆大學(xué)兼職講授機(jī)器人課程,他把那套固定在汽車(chē)頂端的系統(tǒng)描述為安裝在現(xiàn)代設(shè)備上的“窮人版”巨型神經(jīng)網(wǎng)絡(luò)。所謂深度學(xué)習(xí),其實(shí)是一套可以借助海量大數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò),這種技術(shù)正在獲得越來(lái)越多的商業(yè)應(yīng)用——從無(wú)人駕駛汽車(chē)到根據(jù)用戶(hù)瀏覽歷史推薦產(chǎn)品的網(wǎng)站,均屬此類(lèi)。
?
這還有望成為一項(xiàng)無(wú)處不在的科技。未來(lái)的射電天文學(xué)觀測(cè)可以借助深度學(xué)習(xí)尋找有價(jià)值的信號(hào),幫助天文學(xué)家應(yīng)對(duì)難以處理的海量數(shù)據(jù)。引力波探測(cè)者也可以借此理解和消除最細(xì)微的噪音來(lái)源。而發(fā)行商同樣可以利用這種技術(shù)過(guò)濾和標(biāo)記數(shù)以百萬(wàn)的論文和圖書(shū)。
?
一些研究人員相信,融合了深度學(xué)習(xí)技術(shù)的電腦最終甚至有可能具備想象力和創(chuàng)造力?!拔覀冎苯訛槠涮峁?shù)據(jù),它就會(huì)按照自然規(guī)律進(jìn)行反饋?!奔又堇砉W(xué)院物理學(xué)家簡(jiǎn)?洛奇弗里曼特(Jean-RochVlimant)說(shuō)。
?
但這些優(yōu)勢(shì)恰恰也會(huì)導(dǎo)致黑盒子問(wèn)題越發(fā)嚴(yán)重。例如,這些機(jī)器究竟是如何找到有意義的信號(hào)的?如何確定它們的結(jié)論正確與否?人們應(yīng)該給予深度學(xué)習(xí)技術(shù)多大的信任?
?
“我認(rèn)為我們肯定會(huì)屈從于這些算法。”哥倫比亞大學(xué)機(jī)器人專(zhuān)家霍德?立普森(Hod Lipson)說(shuō)。他表示,這就好比碰到了一種擁有智慧的外星生物,他們的視覺(jué)受體不僅能感受到紅、綠、藍(lán)三種色彩,還能感知第四種顏色。人類(lèi)很難理解這種外星生物看待世界的方式,而這種外星生物也很難向我們解釋清楚。
?
他表示,電腦在向我們解釋事情的過(guò)程中也會(huì)面臨類(lèi)似的困難,“從某種意義上講,就像跟一條狗解釋莎士比亞一樣?!?br />
?
面對(duì)這些挑戰(zhàn),人工智能研究人員開(kāi)始采取與鮑莫里奧一樣的應(yīng)對(duì)策略——他們紛紛開(kāi)始研究黑盒子里的秘密,并借助神經(jīng)系統(tǒng)科學(xué)了解神經(jīng)網(wǎng)絡(luò)的內(nèi)部原理。但歐洲核子研究組織(CERN)的物理學(xué)家文森佐?伊諾森特(Vincenzo Innocente)表示,目前得出的答案還不夠深刻?!白鳛橐幻茖W(xué)家,我們不僅要知其然,還要知其所以然。”他說(shuō)。
?
技術(shù)原理
?
第一個(gè)人工神經(jīng)網(wǎng)絡(luò)創(chuàng)造于1950年代初,幾乎是在能夠執(zhí)行算法的電腦誕生后立刻出現(xiàn)的。當(dāng)時(shí)的想法是模擬“神經(jīng)元”這種小型計(jì)算單元——它由大量的數(shù)字“突觸”相連,呈層狀排列。底層的每個(gè)單元吸收額外的數(shù)據(jù)(例如一個(gè)圖片中的像素),然后將這些信息發(fā)送給下一層的部分或全部單元。
?
第二層的每個(gè)單元之后使用簡(jiǎn)單的數(shù)學(xué)規(guī)則融合從第一層吸收的信息,然后將結(jié)果進(jìn)一步向上傳遞。最終,頂層便可得出答案——判斷最初那張圖片里的動(dòng)物究竟是“貓”還是“狗”。
?
這類(lèi)網(wǎng)絡(luò)的優(yōu)勢(shì)在于它們的學(xué)習(xí)能力。利用附帶正確答案的數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練后,它們便可通過(guò)調(diào)整每個(gè)連接來(lái)大幅改進(jìn)效果,直到頂層也輸出正確答案為止。這一過(guò)程通過(guò)加強(qiáng)和弱化突觸的方式模擬了人腦的學(xué)習(xí)方式,最終生成了一個(gè)網(wǎng)絡(luò),使之可以對(duì)從未見(jiàn)過(guò)的新數(shù)據(jù)進(jìn)行歸類(lèi)。
?
在1990年代,這種學(xué)習(xí)能力對(duì)歐洲核子研究組織的物理學(xué)家形成了巨大吸引力,他們當(dāng)時(shí)成為首批在科研工作中定期使用大規(guī)模神經(jīng)網(wǎng)絡(luò)的機(jī)構(gòu)之一:在再現(xiàn)大型強(qiáng)子對(duì)裝機(jī)的粒子對(duì)撞產(chǎn)生的亞原子顆粒軌道時(shí),這些神經(jīng)網(wǎng)絡(luò)起到了巨大的幫助。
?
但這種學(xué)習(xí)模式正是信息在網(wǎng)絡(luò)中如此分散的原因:與在大腦中一樣,記憶會(huì)利用多重連接進(jìn)行編碼,而不是像傳統(tǒng)數(shù)據(jù)庫(kù)一樣存儲(chǔ)在某個(gè)具體的位置。“你電話(huà)號(hào)碼的第一個(gè)數(shù)字存儲(chǔ)在大腦的哪個(gè)位置?可能在很多突觸上,或許距離其他數(shù)字不遠(yuǎn)?!奔又荽髮W(xué)歐文分校機(jī)器學(xué)習(xí)研究員皮埃爾?巴爾迪(Pierre Baldi)說(shuō)。
?
但并沒(méi)有明確的比特序列對(duì)數(shù)字進(jìn)行編碼。懷俄明大學(xué)計(jì)算機(jī)科學(xué)家杰夫?克魯尼(Jeff Clune)表示,因此,“即使我們開(kāi)發(fā)了這些網(wǎng)絡(luò),我們對(duì)它的了解仍然像對(duì)人腦的了解一樣不夠深入?!?br />
?
那些需要在自己的學(xué)科領(lǐng)域處理大數(shù)據(jù)的科學(xué)家,在使用深度學(xué)習(xí)時(shí)則會(huì)保持一份謹(jǐn)慎。牛津大學(xué)計(jì)算機(jī)科學(xué)教授安德里亞?維達(dá)爾迪(Andrea Vedaldi)表示,想要了解背后的原因,可以設(shè)想一種情形:在不遠(yuǎn)的將來(lái),可以使用最終患上乳腺癌的女性的乳房X光片對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
?
維達(dá)爾迪表示,經(jīng)過(guò)訓(xùn)練后,機(jī)器便可從一個(gè)看似健康的婦女身上“看出”癌變?!吧窠?jīng)網(wǎng)絡(luò)可以學(xué)會(huì)識(shí)別各種跡象——這些性狀有可能是我們尚不了解的,但卻可以用于預(yù)測(cè)癌癥?!彼f(shuō)。
?
但維達(dá)爾迪表示,如果機(jī)器無(wú)法解釋它是如何診斷的,就會(huì)給醫(yī)生及其病人帶來(lái)嚴(yán)重的困惑。對(duì)一位女士而言,即使是自己的基因中含有可以大幅提升乳腺癌患病幾率的遺傳變異,也很難促使其下決心接受預(yù)防性的乳房切除術(shù)。而如果在不知道具體風(fēng)險(xiǎn)因素的情況下,她就更加難以作出決定——即便機(jī)器給出的建議可以實(shí)現(xiàn)很高的預(yù)測(cè)率。
?
“問(wèn)題在于,知識(shí)被神經(jīng)網(wǎng)絡(luò)吸收了,但卻沒(méi)有被我們吸收?!惫雀?微博)生物物理學(xué)家邁克爾?蒂卡(Michael Tyka)說(shuō),“我們了解了什么事情?什么也沒(méi)有——但神經(jīng)網(wǎng)絡(luò)卻學(xué)到了東西?!?br />
?
從2012年起就有一些團(tuán)隊(duì)開(kāi)始研究黑盒子問(wèn)題。一個(gè)由多倫多大學(xué)機(jī)器學(xué)習(xí)專(zhuān)家杰弗里?欣頓(Geoffrey Hinton)領(lǐng)導(dǎo)的團(tuán)隊(duì)參加了一次計(jì)算機(jī)視覺(jué)競(jìng)賽,并首次證明深度學(xué)習(xí)可以對(duì)120萬(wàn)張圖片組成的數(shù)據(jù)庫(kù)進(jìn)行歸類(lèi),處理能力遠(yuǎn)超其他任何一項(xiàng)人工智能技術(shù)。
?
在深入挖掘了背后的原理后,維達(dá)爾迪的團(tuán)隊(duì)利用欣頓開(kāi)發(fā)的算法改進(jìn)了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練流程,并且采用了截然相反的運(yùn)行模式。他們并未教給神經(jīng)網(wǎng)絡(luò)如何正確地解讀一張圖片,而是開(kāi)始對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)先訓(xùn)練,然后重構(gòu)創(chuàng)建這些網(wǎng)絡(luò)時(shí)使用的圖片。這可以幫助研究人員確定機(jī)器是如何表現(xiàn)各種特征的——就好像他們?cè)谠?xún)問(wèn)一個(gè)想象中的癌癥診斷神經(jīng)網(wǎng)絡(luò):“乳房x光片的哪個(gè)部分讓你認(rèn)為存在癌癥風(fēng)險(xiǎn)?”
?
去年,蒂卡和其他谷歌研究人員也采用了類(lèi)似的模式。他們的算法名叫“深夢(mèng)”(Deep Dream),首先從圖片開(kāi)始(例如花朵或海灘),然后通過(guò)修改圖片加強(qiáng)某些頂層神經(jīng)元的反應(yīng)。例如,如果神經(jīng)元喜歡將圖片標(biāo)記為鳥(niǎo),那么修改后的圖片就會(huì)到處是鳥(niǎo)。最終的圖片會(huì)調(diào)動(dòng)起一場(chǎng)虛幻之旅,各種各樣的鳥(niǎo)從人臉、建筑和各種圖片中顯現(xiàn)出來(lái)。
?
同時(shí)身為藝術(shù)家的蒂卡說(shuō),“我認(rèn)為這更像一種幻覺(jué),”而非夢(mèng)境。當(dāng)他和他的團(tuán)隊(duì)發(fā)現(xiàn)可以使用這種算法進(jìn)行創(chuàng)作時(shí),便對(duì)所有人開(kāi)放下載。幾天之內(nèi),“深夢(mèng)”就在網(wǎng)上火了起來(lái)。
?
這些技術(shù)的作用對(duì)象不僅是頂層神經(jīng)元,而是可以最大程度地加強(qiáng)任何一個(gè)神經(jīng)元的反應(yīng)。通過(guò)這些技術(shù),克魯尼的團(tuán)隊(duì)在2014年發(fā)現(xiàn),黑盒子問(wèn)題或許比我們想象得更加糟糕:令人意外的是,神經(jīng)網(wǎng)絡(luò)非常容易被愚弄,甚至只需要借助人類(lèi)眼中的隨機(jī)噪音或抽象圖案即可實(shí)現(xiàn)。
?
例如,一個(gè)神經(jīng)網(wǎng)絡(luò)或許會(huì)將彎曲的線(xiàn)錯(cuò)當(dāng)成海星,或者把黑黃相間的格子布錯(cuò)當(dāng)成校車(chē)。不僅如此,即便通過(guò)不同的數(shù)據(jù)庫(kù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這些形狀還是會(huì)使其產(chǎn)生相同的反應(yīng)。
?
研究人員提出了多種方法來(lái)解決這個(gè)問(wèn)題,但目前還沒(méi)有找到通用的解決方案。從現(xiàn)實(shí)應(yīng)用的角度來(lái)看,這會(huì)引發(fā)很多危險(xiǎn)??唆斈崃信e了一種令人尤其擔(dān)憂(yōu)的情形:圖謀不軌的黑客可以利用這些缺陷:他們可以借此讓一輛無(wú)人駕駛汽車(chē)把廣告牌誤認(rèn)為是道路,從而引發(fā)事故;或者讓虹膜掃描器把入侵者誤認(rèn)為是美國(guó)總統(tǒng)奧巴馬,使之可以隨意出入白宮。“我們得認(rèn)真研究一番,只有這樣才能讓機(jī)器學(xué)習(xí)更強(qiáng)大、更智能?!笨唆斈嵴f(shuō)。
?
由于存在這些問(wèn)題,一些計(jì)算機(jī)科學(xué)家認(rèn)為,基于神經(jīng)網(wǎng)絡(luò)技術(shù)的深度學(xué)習(xí)并非唯一的解決方案。英國(guó)劍橋大學(xué)機(jī)器學(xué)習(xí)研究人員左斌?加拉瑪尼(Zoubin Ghahramani)表示,如果人工智能的目的是解答人類(lèi)可以輕松搞定的問(wèn)題,“那就還有很多問(wèn)題是深度學(xué)習(xí)無(wú)法解答的?!?br />
?
立普森和前康奈爾大學(xué)計(jì)算生物學(xué)家邁克爾?施密特(Michael Schmidt)2009年設(shè)計(jì)了一種相對(duì)透明的科研方法。這種名為Eureqa的算法能夠通過(guò)觀察相對(duì)簡(jiǎn)單的機(jī)械對(duì)象(一套鐘擺系統(tǒng))的運(yùn)動(dòng)重新發(fā)現(xiàn)牛頓力學(xué)定律。
?
首先從數(shù)學(xué)符號(hào)的隨機(jī)組合開(kāi)始,包括加號(hào)、減號(hào)、正弦、余弦,Eureqa采用了受到達(dá)爾文進(jìn)化論啟發(fā)的試錯(cuò)法來(lái)不斷調(diào)整,直到得出能夠確切描述數(shù)據(jù)的公式。它隨后會(huì)設(shè)計(jì)一些試驗(yàn)來(lái)檢驗(yàn)自己的模型。立普森表示,這套算法的一大優(yōu)勢(shì)是簡(jiǎn)單。“Eureqa生成的模型通常有12個(gè)參數(shù),而神經(jīng)網(wǎng)絡(luò)則有幾百萬(wàn)個(gè)?!?br />
?
去年,加拉瑪尼發(fā)布了一套算法,可以自動(dòng)完成數(shù)據(jù)科學(xué)家的工作,從分析原始數(shù)據(jù)到撰寫(xiě)論文的整個(gè)流程都包含在內(nèi),他的這套名為“自動(dòng)統(tǒng)計(jì)員”(Automatic Statistician)的軟件可以確定數(shù)據(jù)庫(kù)里的趨勢(shì)和異常值,然后得出自己的結(jié)論,甚至對(duì)它的推理進(jìn)行詳細(xì)的解釋。
?
加拉瑪尼表示,這種透明性在科學(xué)應(yīng)用中“至關(guān)重要”,對(duì)很多商業(yè)應(yīng)用同樣如此。例如,在很多國(guó)家,拒絕發(fā)放貸款的銀行有義務(wù)闡述原因——深度學(xué)習(xí)算法或許就無(wú)法勝任這項(xiàng)工作。
?
奧斯陸大數(shù)據(jù)公司Arundo Analytics的數(shù)據(jù)科學(xué)總監(jiān)艾利?多布森(Ellie Dobson)表示,很多機(jī)構(gòu)也都懷有類(lèi)似的擔(dān)憂(yōu)。如果英國(guó)利率的設(shè)定引發(fā)了什么問(wèn)題,“英格蘭銀行不能簡(jiǎn)單地說(shuō)一句‘黑盒子使然’就了事?!?br />
?
盡管存在這些擔(dān)在這些擔(dān)憂(yōu),但計(jì)算機(jī)科學(xué)家還是認(rèn)為,透明的人工智能是對(duì)深度學(xué)習(xí)的一種補(bǔ)充,而非替代。他們表示,一些透明的技術(shù)或許比較擅長(zhǎng)解決已經(jīng)被描述成一組抽象事實(shí)的問(wèn)題,但感知能力——也就是從原始數(shù)據(jù)中提取事實(shí)的能力——卻不夠好。
?
最終,這些研究人員認(rèn)為,機(jī)器學(xué)習(xí)提供的復(fù)雜答案必須成為科學(xué)工具包的一部分,因?yàn)檎鎸?shí)世界非常復(fù)雜:對(duì)于天氣和股市等現(xiàn)象,可能根本就不存在既簡(jiǎn)單又全面的描述?!坝行┦虑檎f(shuō)不清楚?!卑屠杈C合理工大學(xué)應(yīng)用數(shù)學(xué)家史蒂芬?馬拉特(Stéphane Mallat)說(shuō),“如果你問(wèn)醫(yī)生,他為什么給處這樣或那樣的診斷,他或許會(huì)給你一些理由。但培養(yǎng)一個(gè)好醫(yī)生為什么要花20年?因?yàn)楹芏嘈畔⑹钦n本上學(xué)不到的?!?br />
?
對(duì)巴爾迪來(lái)說(shuō),科學(xué)家擁抱深度學(xué)習(xí)技術(shù)時(shí)不應(yīng)該過(guò)分擔(dān)心黑盒子。畢竟,每個(gè)人的腦子里都有一個(gè)黑盒子?!澳汶S時(shí)都在使用你的大腦,但你卻時(shí)刻信任自己的大腦,然而,你其實(shí)并不了解大腦的工作方式。”