隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)算法的應(yīng)用愈發(fā)關(guān)鍵。近期,一項(xiàng)新的技術(shù)正深入研究,以揭示語(yǔ)言處理網(wǎng)絡(luò)內(nèi)部工作的原理,讓機(jī)器學(xué)習(xí)算法解釋自己的決策過(guò)程與目的。
神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力推動(dòng)了最近的人工智能熱潮,但很難解釋他們是如何做出決定的。一項(xiàng)旨在揭示語(yǔ)言處理網(wǎng)絡(luò)內(nèi)部工作原理的新技術(shù),只是為揭示這些“黑匣子”而做出的最新努力。
我們發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)如此神秘,這可能并不奇怪,因?yàn)樗鼈兓旧鲜腔谌祟惔竽X而建立的,我們也在努力破譯這些神經(jīng)網(wǎng)絡(luò)。他們學(xué)習(xí)的模型并不像傳統(tǒng)的計(jì)算機(jī)程序那樣整齊地存儲(chǔ)在數(shù)據(jù)庫(kù)中,而是由成千上萬(wàn)的虛擬神經(jīng)元之間的連接組成。
這些連接不是由人類程序員設(shè)定的,相反,神經(jīng)網(wǎng)絡(luò)本質(zhì)上是通過(guò)在大量數(shù)據(jù)中尋找模式來(lái)進(jìn)行編程。因此,雖然你可以測(cè)試一個(gè)神經(jīng)網(wǎng)絡(luò)在照片中檢測(cè)到貓的效果,但要判斷出它們的存在與否,你很難辨明它們的視覺(jué)模式。
“當(dāng)涉及到照片中貓的檢測(cè)時(shí),這并不是什么大問(wèn)題,但這項(xiàng)技術(shù)正在悄然進(jìn)入一些領(lǐng)域,在這些領(lǐng)域,能夠解釋這些決定可能很重要?!?/p>
說(shuō)到檢測(cè)到貓的存在,這并不是什么大問(wèn)題,但這項(xiàng)技術(shù)正在悄然進(jìn)入一些領(lǐng)域,在這些領(lǐng)域中,能夠解釋這些決策可能很重要,比如金融交易和疾病診斷。這導(dǎo)致了越來(lái)越多的研究試圖讓這些算法的決策能解釋得更清楚。
本月上旬,麻省理工學(xué)院的工程師們公布了一項(xiàng)技術(shù),該技術(shù)有望提供關(guān)于任何自然語(yǔ)言處理網(wǎng)絡(luò)的洞察和分析,而不管其背后的軟件是什么。這是因?yàn)樗墓ぷ髟硎呛?jiǎn)單地把輸入轉(zhuǎn)換成算法,并測(cè)量對(duì)輸出的影響。
該研究小組利用他們自己的神經(jīng)網(wǎng)絡(luò),對(duì)自然句子進(jìn)行壓縮和解壓,得出與之相關(guān)的句子,然后將這些句子輸入到被訪問(wèn)的神經(jīng)網(wǎng)絡(luò)中。通過(guò)分析輸入的細(xì)微變化如何改變輸出,研究人員能夠發(fā)現(xiàn)網(wǎng)絡(luò)對(duì)特定詞匯和短語(yǔ)的反應(yīng)。
他們進(jìn)行的一項(xiàng)測(cè)試是在微軟Azure云服務(wù)的一項(xiàng)翻譯服務(wù)上進(jìn)行的。法語(yǔ)有不同的名詞形式,這些名詞形式取決于主語(yǔ)的性別。例如,男舞者是“danseur”,而女性舞者則是“danseuse”。
研究人員發(fā)現(xiàn),在包含諸如博士、教授等職業(yè)的句子中,這種模型容易表現(xiàn)出男性化的傾向,比如聰明的或有天賦的,而在模型表現(xiàn)成女性化的形式時(shí),則傾向于迷人的或者富有同情心的主體,比如舞者或護(hù)士。
這種性別傾向很難通過(guò)簡(jiǎn)單地搜索翻譯服務(wù)的神經(jīng)網(wǎng)絡(luò)架構(gòu)來(lái)發(fā)現(xiàn),但其影響可能是潛在的。能夠發(fā)現(xiàn)這種傾向是促使神經(jīng)網(wǎng)絡(luò)更容易解釋的關(guān)鍵因素,但它也可以幫助研究人員排除那些導(dǎo)致錯(cuò)誤的假設(shè),從而提高他們的表現(xiàn)。
麻省理工學(xué)院的這一研究也遵循了華盛頓大學(xué)的類似研究,該研究也使用了輸入的變量來(lái)觀察模型的預(yù)測(cè)行為。它解決了分類算法更簡(jiǎn)單的問(wèn)題,但它也可以通過(guò)突出顯示圖像的某些部分來(lái)進(jìn)行預(yù)測(cè),從而在圖像處理算法方面發(fā)揮作用。
英偉達(dá)提出了一種更簡(jiǎn)單的方法,可以在處理自動(dòng)駕駛汽車的PilotNet系統(tǒng)所使用的視頻時(shí)實(shí)現(xiàn)同樣的效果。通過(guò)把網(wǎng)絡(luò)的更高層次的輸出疊加到下層上,他們就能創(chuàng)建一個(gè)“可視化的面具”,突出顯示網(wǎng)絡(luò)認(rèn)為重要的實(shí)時(shí)視頻消息流的功能。
更進(jìn)一步的話,一些研究人員試圖創(chuàng)造出人工智能來(lái)解釋它的決定,而不僅僅是專家來(lái)進(jìn)行解釋。來(lái)自美國(guó)和德國(guó)的研究人員最近公布了一種算法,該算法不僅可以分析圖片,回答“哪種運(yùn)動(dòng)正在播放”等問(wèn)題,還可以用“棒球員手握球棒”這樣的短語(yǔ)來(lái)回答“棒球”這樣的問(wèn)題。
Mark Riedl是位于亞特蘭大的喬治亞理工學(xué)院娛樂(lè)情報(bào)實(shí)驗(yàn)室的主任,他讓一些人玩了電腦游戲“青蛙”,并在他們玩的過(guò)程中解釋他們的策略。他將這些數(shù)據(jù)與描述游戲狀態(tài)的代碼一起記錄下來(lái),然后在這兩種情況下訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)。當(dāng)他把這個(gè)網(wǎng)絡(luò)連接到另一個(gè)設(shè)計(jì)游戲的網(wǎng)絡(luò)時(shí),他創(chuàng)造了一個(gè)人工智能,使其可以在玩游戲的過(guò)程中合理化自己的行為。
雖然對(duì)可解釋的人工智能研究還處于初級(jí)階段,但歐盟最近的一項(xiàng)指令可能會(huì)給該領(lǐng)域的研究增添一種緊迫感。定于明年生效的通用數(shù)據(jù)保護(hù)條例(GDPR)將有效地創(chuàng)造一種“解釋權(quán)”,使公民能夠要求做出關(guān)于算法決策背后的邏輯。
正如埃森哲的分析師在一篇博客文章中指出的那樣,關(guān)于這種新權(quán)利的程度存在爭(zhēng)議,但他們?nèi)匀唤ㄗh企業(yè)接受可解釋的人工智能,以便在未來(lái)證明自己的企業(yè)不受監(jiān)管機(jī)構(gòu)的影響。
這一領(lǐng)域也可能會(huì)有大筆資金投入。金融巨頭Capital One正在研究如何讓機(jī)器學(xué)習(xí)算法來(lái)解釋他們的決策,美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)正在資助13個(gè)致力于解決這個(gè)問(wèn)題的研究小組。這其中包括來(lái)自俄勒岡州立大學(xué)的一個(gè)小組,他們計(jì)劃用第二個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)分析神經(jīng)網(wǎng)絡(luò),以確定神經(jīng)活動(dòng)對(duì)特定決策的影響。
但谷歌的研究主管Peter Norvig最近質(zhì)疑這些方法最終會(huì)有多大用處。他說(shuō),即使有了人類,認(rèn)知心理學(xué)家也發(fā)現(xiàn),當(dāng)你讓別人解釋他們的決定時(shí),他們通常會(huì)以可能與實(shí)際決策過(guò)程無(wú)關(guān)的方式來(lái)理解他們的行為。他在悉尼的一次活動(dòng)上說(shuō):“因此,我們可能會(huì)在機(jī)器學(xué)習(xí)領(lǐng)域處于同一個(gè)位置,在這個(gè)階段我們訓(xùn)練一個(gè)系統(tǒng)來(lái)獲得答案,考慮到第一個(gè)系統(tǒng)的輸入,然后我們才會(huì)訓(xùn)練另一個(gè)系統(tǒng),現(xiàn)在你的工作就是做出解釋?!?/p>
相反,他說(shuō),隨著時(shí)間的推移,研究這些算法的輸出可能會(huì)更有用,以識(shí)別偏差和錯(cuò)誤。那么,問(wèn)題是這是誰(shuí)的責(zé)任:是過(guò)度擴(kuò)張的公共機(jī)構(gòu)、還是學(xué)術(shù)機(jī)構(gòu)或企業(yè),在保護(hù)其人工智能能力的聲譽(yù)方面擁有既得利益。
在現(xiàn)實(shí)中,這可能需要兩者的結(jié)合。人工智能開(kāi)發(fā)者需要找到方法來(lái)解釋他們的創(chuàng)意所做出的決定,但我們不能只接受他們的說(shuō)法。還需要對(duì)這些決定如何影響人們的生活進(jìn)行密切的觀察。
來(lái)源:網(wǎng)易智能