事實(shí)上,在這場由ChatGPT激起的新一輪AI浪潮中,全球科技巨頭、AI廠商、行業(yè)翹楚等紛紛下場,唯恐錯(cuò)過此番科技盛宴。同時(shí),GenAI蓬勃發(fā)展產(chǎn)業(yè)規(guī)模也在高速增長,麥肯錫調(diào)查數(shù)據(jù)顯示,2022年GenAI市場收入為400億美元,預(yù)計(jì)2027年及2032年將分別達(dá)到3990億美元和13040億美元。
2023年即將過去,2024年即將到來。在包括戴爾科技、Gartner、IDC發(fā)布的2024年技術(shù)趨勢預(yù)測中,GenAI的熱度并沒有隨著舊的一年的過去而消散,相反,在新的一年GenAI依舊成為科技領(lǐng)域的“寵兒”。戴爾科技集團(tuán)全球首席技術(shù)官John?Roese表示:“GenAI仍然是2024年重點(diǎn)話題之一,并且將從2023年的純理論探索階段,進(jìn)入業(yè)務(wù)應(yīng)用階段?!?/p>
從理論到實(shí)踐,2024年成GenAI進(jìn)化的關(guān)鍵一年
John?Roese之所以將GenAI的發(fā)展趨勢總結(jié)為“從理論階段轉(zhuǎn)向?qū)嵺`階段”是有其原因的。
我們可以看到,ChatGPT的崛起又掀起了人工智能發(fā)展的新一波浪潮,也釋放出頭部互聯(lián)網(wǎng)企業(yè)和AI廠商的創(chuàng)新密度和熱情,從國內(nèi)來看,根據(jù)公開資料不完全統(tǒng)計(jì)顯示,截至2023年11月30日,國內(nèi)已經(jīng)有至少200家大模型廠商推出了各自的大模型。可以說,在GenAI的這個(gè)賽道里,每家企業(yè)都公平地?fù)碛锌萍紕?chuàng)新“入場券”,擁有參與競爭的權(quán)利。
然而,這些“繁榮”的背后并沒有改變一個(gè)事實(shí),也就是如果企業(yè)不具備產(chǎn)品市場契合度或可持續(xù)的競爭優(yōu)勢,人工智能生態(tài)系統(tǒng)的整體繁榮是不可能持續(xù)的。當(dāng)頭部企業(yè)裹挾GenAI從技術(shù)淘汰的第一階段進(jìn)入能夠端到端地解決人們問題的第二階段之時(shí),企業(yè)不得不面對“物競天擇,優(yōu)勝劣汰”。
從第一階段到第二階段的進(jìn)化,便是John?Roese所說的,2024年GenAI將從理論階段進(jìn)入到業(yè)務(wù)應(yīng)用階段。而Gartner對于未來GenAI的預(yù)測,也佐證了這一觀點(diǎn),它預(yù)測到2026年,超過80%的企業(yè)都會(huì)接入生成式AI或大模型,然而這一比例在2023年初還不到5%。在筆者看來,接入GenAI是其進(jìn)入業(yè)務(wù)應(yīng)用階段的重要表現(xiàn),如果這一數(shù)據(jù)可靠的話,那么,2024年、2025年、2026年將成為關(guān)鍵的3年。
從理論到實(shí)踐,GenAI如何實(shí)現(xiàn)進(jìn)化?
在2024這一具有關(guān)鍵意義的一年,GenAI將如何完成從理論到實(shí)踐的進(jìn)化?John?Roese也給出了相應(yīng)的解答:其一,GenAI將從構(gòu)建訓(xùn)練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu);其二,企業(yè)的關(guān)注點(diǎn)將越來越多地從寬泛的實(shí)驗(yàn)轉(zhuǎn)向自上而下的戰(zhàn)略重點(diǎn),暨挑選出少數(shù)幾個(gè)真正具有變革意義的GenAI項(xiàng)目;其三,經(jīng)濟(jì)方面的討論重點(diǎn)將從訓(xùn)練成本轉(zhuǎn)向運(yùn)營成本。
通常,GenAI分為兩個(gè)階段:在訓(xùn)練階段,訓(xùn)練構(gòu)成GenAI系統(tǒng)核心的大語言模型,在推理階段,使用這些訓(xùn)練有素的大語言模型來運(yùn)行應(yīng)用程序?!皩enAI投入到企業(yè)業(yè)務(wù)用例的這一過程中,訓(xùn)練GenAI只是起步,進(jìn)入業(yè)務(wù)應(yīng)用場景前,企業(yè)將在基礎(chǔ)模型上進(jìn)行調(diào)優(yōu),使用海量的數(shù)據(jù)喂養(yǎng)GenAI,從而釋放GenAI的生產(chǎn)力?!盝ohn?Roese如是說。
在筆者看來,在即將到來的2024年,越來越多的企業(yè)將從關(guān)注訓(xùn)練階段到關(guān)注推理階段,相應(yīng)的GenAI也將從構(gòu)建訓(xùn)練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu)。John?Roese認(rèn)為在這一趨勢變化下,企業(yè)需要考慮如何更好地設(shè)計(jì)推理基礎(chǔ)架構(gòu),將這些推理基礎(chǔ)架構(gòu)部署在哪里,以及如何確保推理基礎(chǔ)架構(gòu)的安全性。與此同時(shí),對于這些問題,John?Roese也作出了相應(yīng)的解答。
以設(shè)計(jì)推理架構(gòu)為例,在推理階段,企業(yè)需要的基礎(chǔ)架構(gòu)的類型取決于用戶規(guī)模和模型的類型,比如,少量的用戶使用成熟的GenAI,那就需要一臺(tái)服務(wù)器,而在用戶眾多的情況下,便需要增加服務(wù)器。John?Roese表示:“除了用戶訓(xùn)練的基礎(chǔ)架構(gòu),企業(yè)還需要更好地理解、清楚如何打造一個(gè)推理基礎(chǔ)架構(gòu)”。
從寬泛的實(shí)驗(yàn)轉(zhuǎn)向自上而下的戰(zhàn)略重點(diǎn)也是GenAI進(jìn)化中企業(yè)的關(guān)注點(diǎn)之一。可以看到,GenAI誕生伊始便讓企業(yè)、組織、部門不斷思考如何使用GenAI改變自身業(yè)務(wù)方式。然而,在真正實(shí)施的過程中,企業(yè)開始意識(shí)到,在海量的企業(yè)項(xiàng)目中構(gòu)建和實(shí)施真正投入生產(chǎn)的生成式AI的系統(tǒng),需要占用大量的人力、物力、財(cái)力。
因此,挑選出少數(shù)幾個(gè)真正具有變革意義的GenAI項(xiàng)目進(jìn)行實(shí)踐對于企業(yè)來講尤為重要。John?Roese表示:“2024年企業(yè)CIO和企業(yè)領(lǐng)導(dǎo)者也必須做一個(gè)決定,那就是在企業(yè)內(nèi)部挑選出來的數(shù)個(gè)或數(shù)十個(gè)要實(shí)施GenAI的項(xiàng)目中,再選出幾個(gè)項(xiàng)目優(yōu)先實(shí)施?!?/p>
另外一個(gè)值得關(guān)注的變化是,企業(yè)關(guān)注的重點(diǎn)將從訓(xùn)練成本轉(zhuǎn)向運(yùn)營成本。這一點(diǎn)與筆者論證的越來越多的企業(yè)將從關(guān)注訓(xùn)練階段到關(guān)注推理階段這一觀點(diǎn)不謀而合,可以說,后者的變化在一定程度上決定了企業(yè)關(guān)注的成本的變化。
戴爾科技研究發(fā)現(xiàn),2023年GenAI的成本主要集中在訓(xùn)練成本,比如訓(xùn)練大模型需要的服務(wù)器數(shù)量、架構(gòu)開發(fā)和維護(hù)人員等。然而對于企業(yè)而言,在應(yīng)用階段使用這些GenAI的主要開支為運(yùn)營成本。John?Roese表示:“所以從明年開始,隨著越來越多的企業(yè)使用GenAI,我們將會(huì)發(fā)現(xiàn)企業(yè)的成本將會(huì)由訓(xùn)練成本轉(zhuǎn)向運(yùn)營成本?!?/p>
零信任、邊緣平臺(tái)、量子計(jì)算將發(fā)揮巨大價(jià)值
如今,零信任已成為網(wǎng)絡(luò)安全技術(shù)的主旋律。作為新的安全范式,零信任可明確識(shí)別用戶和設(shè)備,并授予其適當(dāng)?shù)脑L問權(quán)限,以便企業(yè)能夠以最小的摩擦進(jìn)行運(yùn)營,同時(shí)降低風(fēng)險(xiǎn)。因此,在筆者看來零信任可以作為一種安全方式或范式、一種戰(zhàn)略或某些特定架構(gòu)和技術(shù)實(shí)施加以應(yīng)用。Gartner預(yù)測到2025年,至少70%的新增遠(yuǎn)程部署將使用零信任網(wǎng)絡(luò)訪問。
對于零信任的趨勢,John?Roese表示:“整個(gè)2023年充斥著對零信任及其在全球網(wǎng)絡(luò)安全工作中重要性的討論。在即將到來的2024年,零信任也不再只是一個(gè)熱門話題,將聚焦落實(shí)真正的技術(shù)、架構(gòu)、標(biāo)準(zhǔn)和認(rèn)證,從而實(shí)現(xiàn)零信任的全部優(yōu)勢。”據(jù)戴爾科技透露,戴爾科技正在與全球生態(tài)系統(tǒng)領(lǐng)導(dǎo)者合作,簡化零信任集成。
如今,云網(wǎng)邊端架構(gòu)日益深入人心,事實(shí)上,通過構(gòu)建云網(wǎng)邊端協(xié)同架構(gòu),可以實(shí)現(xiàn)終端物聯(lián)網(wǎng)設(shè)備的便捷通信和可靠的數(shù)據(jù)交互,滿足不同行業(yè)的差異化服務(wù)。結(jié)合云計(jì)算和邊緣計(jì)算的優(yōu)勢,云網(wǎng)邊端協(xié)同應(yīng)運(yùn)而生,通過云邊協(xié)同網(wǎng)絡(luò),可在為終端用戶提供低延時(shí)服務(wù)的同時(shí)提高數(shù)據(jù)的處理速度??梢哉f,邊緣平臺(tái)并不是機(jī)械式地?zé)o限擴(kuò)展,而是云網(wǎng)邊端協(xié)同的發(fā)展。
對此,John?Roese分享說,企業(yè)將認(rèn)識(shí)到構(gòu)建現(xiàn)代化邊緣有兩種方式:邊緣孤島的擴(kuò)展和多云邊緣平臺(tái)的搭建。未來的發(fā)展方向?qū)⑹呛笳?,即采用“邊緣平臺(tái)”讓現(xiàn)代化邊緣成為多云基礎(chǔ)架構(gòu)的延伸。John?Roese透露,“在2023年戴爾科技便有建立統(tǒng)一基礎(chǔ)架構(gòu)與應(yīng)用管理愿景,而在GenAI落地實(shí)踐的2024年,戴爾科技也將開始落實(shí)一些概念和設(shè)想?!?/p>
此外,John?Roese還預(yù)測,量子計(jì)算將帶來AI系統(tǒng)能力的巨大飛躍。在他看來,量子計(jì)算解決了GenAI和大多數(shù)大規(guī)模AI對計(jì)算資源需求量極大這一主要問題。事實(shí)上,量子計(jì)算具備無限處理數(shù)據(jù)的能力,也能從海量的數(shù)據(jù)中選擇最優(yōu)的答案,因此,使用量子計(jì)算優(yōu)化GenAI之后,能夠讓GenAI更加有效,運(yùn)行得更好。