在過去的18個月里,我觀察到關(guān)于大型語言模型(LLMs)和GenAI的討論正在迅速增長。對于未來的興奮和夸大的猜測也隨之膨脹——甚至可能形成了泡沫,這給當(dāng)前AI工具的實際應(yīng)用投下了陰影,這種炒作凸顯了目前AI的深刻局限性,同時也削弱了這些工具在實際應(yīng)用中的潛力。
我們?nèi)匀惶幱贏I的“幼兒期”,像ChatGPT這樣的流行AI工具雖然有趣且在某種程度上有用,但它們尚不能被完全依賴來完成整體工作,它們的答案不可避免地帶有創(chuàng)造它們的人類的錯誤和偏見,以及它們訓(xùn)練所用來源的影響,這些來源的可靠性也常常令人懷疑,這些“幻覺”更像是我們自身心理的投射,而非真正的、正在萌芽的智能。
此外,還存在一些真實而具體的問題,例如AI迅速增加的能源消耗,這有可能加速一場生存性的氣候危機。最近的一份報告發(fā)現(xiàn),例如,Google的AI系統(tǒng)在應(yīng)對搜索請求時必須創(chuàng)建全新的信息,這比直接從一個來源提取信息大約需要多30倍的能量,與ChatGPT進行一次互動所消耗的電力相當(dāng)于一個60瓦燈泡亮三分鐘所需的電量。
那么,誰在“幻想”呢?
我的一位同事毫不諷刺地聲稱,由于AI的出現(xiàn),高中教育將在五年內(nèi)變得過時,并且到2029年我們將生活在一個人人平等的天堂,擺脫繁瑣的勞動,這一預(yù)測受到了Ray Kurzweil關(guān)于“AI奇點”預(yù)測的啟發(fā),描繪了一個充滿烏托邦式承諾的未來。
對此,我愿意下注。我認(rèn)為,要從ChatGPT-4的“幻覺”和意外行為發(fā)展到一個我不再需要自己裝洗碗機的世界,可能需要的不僅僅是五年,甚至不止25年。
GenAI存在三個無法解決的棘手問題。如果有人告訴你這些問題總有一天會被解決,你應(yīng)該明白,他們要么對自己在說什么一無所知,要么就是在兜售一些并不存在的東西。他們生活在一個純粹由希望和信念構(gòu)筑的世界里,這個世界里的人曾讓我們相信加密貨幣和比特幣會取代所有銀行,汽車將在五年內(nèi)實現(xiàn)完全自動駕駛,以及元宇宙將取代大多數(shù)人的現(xiàn)實生活。他們現(xiàn)在試圖吸引你的注意力和參與,以便在你上鉤后,他們可以提高價格,然后在市場崩潰之前從你那里賺錢。
三個無法解決的現(xiàn)實問題
幻覺
地球上既沒有足夠的計算能力,也沒有足夠的訓(xùn)練數(shù)據(jù)來解決幻覺問題。GenAI可能會生成事實不正確或無意義的輸出,這使得它在需要高準(zhǔn)確性的關(guān)鍵任務(wù)中不可靠。根據(jù)Google CEO Sundar Pichai的說法,幻覺是GenAI的“固有特性”,這意味著模型開發(fā)者只能期望減少幻覺可能帶來的危害,而無法完全消除它們。
非確定性輸出
GenAI本質(zhì)上是非確定性的,它是一個基于數(shù)十億標(biāo)記的概率引擎,通過實時計算和百分比形成和重組輸出,這種非確定性特質(zhì)意味著AI的回應(yīng)可能會有很大差異,這對軟件開發(fā)、測試、科學(xué)分析或任何需要一致性的領(lǐng)域來說都是一個挑戰(zhàn)。例如,利用AI確定測試移動應(yīng)用特定功能的最佳方法可能會產(chǎn)生一個不錯的結(jié)果,然而,即使你再次輸入相同的提示,也不能保證會得到相同的結(jié)果——這就造成了問題性的變異性。
標(biāo)記補貼
標(biāo)記是AI難題中一個尚未被充分理解的部分。簡單來說,每次你提示一個LLM,你的查詢會被分解為“標(biāo)記”,這些標(biāo)記是你得到的回應(yīng)的種子——回應(yīng)也是由標(biāo)記組成的——你會為每個請求和回應(yīng)中的每個標(biāo)記支付不到一美分的費用。
投資于GenAI生態(tài)系統(tǒng)的數(shù)千億美元中的很大一部分直接用于降低這些成本,以推動廣泛的采用。例如,ChatGPT每天約產(chǎn)生40萬美元的收入,但系統(tǒng)的運營成本需要額外的70萬美元投資補貼才能維持運轉(zhuǎn)。在經(jīng)濟學(xué)中,這被稱為“虧損領(lǐng)袖定價”——還記得2008年Uber有多便宜嗎?你有沒有注意到,當(dāng)它變得普及時,現(xiàn)在的價格已經(jīng)和出租車一樣貴了?將同樣的原理應(yīng)用于Google、OpenAI、Microsoft和Elon Musk之間的AI競賽,你我可能會開始擔(dān)心,當(dāng)他們決定開始盈利時,局面會變得如何。
實際的工作效果
我最近寫了一個腳本,用來從我們的CI/CD管道中提取數(shù)據(jù)并上傳到數(shù)據(jù)湖中。在ChatGPT的幫助下,原本需要我那些生疏的Python技能花費八到十小時的工作,最終只用了不到兩小時——效率提高了80%!只要我不要求每次的答案都完全相同,并且仔細檢查它的輸出,ChatGPT就是我日常工作中值得信賴的伙伴。
GenAI在幫助我進行頭腦風(fēng)暴、為我提供教程或快速學(xué)習(xí)一個非常具體的主題,以及起草一封困難的電子郵件時非常擅長。未來這些方面可能會有些微的改進,并在未來幾年作為我能力的延伸發(fā)揮作用。對我來說,這已經(jīng)足夠好,并且也為投入大量精力開發(fā)這些模型提供了合理的理由。
結(jié)論
雖然GenAI可以幫助完成一些有限的任務(wù),但它并不值得我們重新評估人類本質(zhì),進而導(dǎo)致數(shù)萬億美元的投入。那些在AI方面運用得最好的公司,往往是那些自然處理灰色地帶的公司——比如Grammarly或JetBrains。這些產(chǎn)品非常有用,因為它們運作的環(huán)境中,人們自然會交叉檢查答案,或者那里本來就有多條通向解決方案的路徑。
我認(rèn)為,我們在大型語言模型上的投資——無論是時間、金錢、人力、能源,還是無盡的期望——已經(jīng)遠遠超過了我們可能獲得的回報。這是因為“腐朽經(jīng)濟”和“增長至上”的心態(tài),使我們無法將GenAI定位為一
相當(dāng)出色的工具,用來提高我們30%的生產(chǎn)力。在一個公正的世界里,這已經(jīng)足夠好了,足以圍繞它構(gòu)建一個市場。