如果你出售大量硬件來支持人工智能工作負(fù)載,那么最好的方法就是讓全球各國都相信人工智能是如此重要,以至于他們必須在自己的境內(nèi)擁有大量人工智能。以防某些政治或經(jīng)濟(jì)危機(jī)導(dǎo)致人工智能技術(shù)無法通過遍布全球的云構(gòu)建者獲得。
將大量GPU送到超大規(guī)模和云計(jì)算構(gòu)建者手中是擴(kuò)展GenAI模型以展示其能力的最佳方式,同時(shí)也說明了GenAI對所有國家的戰(zhàn)略重要性。
隨著英偉達(dá)提高其“Hopper”和“Blackwell”GPU的產(chǎn)量,并找到了一種方法來增加其制造產(chǎn)量,以滿足超大規(guī)模和云以及政府和企業(yè)的需求,主權(quán)人工智能云的整個(gè)概念已經(jīng)開始流行起來。英偉達(dá)將是這一趨勢的最大受益者。
上個(gè)月,英偉達(dá)首席執(zhí)行官黃仁勛印度闡述了這種“主權(quán)人工智能”的觀點(diǎn),宣布與印度信實(shí)工業(yè)(Reliance Industries)、印孚瑟斯(Infosys)、Yotta Data Services、塔塔通信(Tata Communications)和Tech Mahindra等主要IT公司和云提供商建立合作關(guān)系,以促進(jìn)印度在整個(gè)經(jīng)濟(jì)中對人工智能的使用。
黃仁勛當(dāng)時(shí)說,“印度應(yīng)該制造自己的人工智能是完全有道理的,你不應(yīng)該輸出數(shù)據(jù)來導(dǎo)入情報(bào)?!?/span>
這對這些國家來說是一件好事,讓它們控制了一項(xiàng)新興技術(shù),這項(xiàng)技術(shù)可能在很多方面從根本上改變商業(yè)運(yùn)作和社會運(yùn)作的方式。主權(quán)人工智能也將是英偉達(dá)的一大勝利,因?yàn)樗鼘⒃谌蚍秶鷥?nèi)傳播自己的信息,更重要的是。英偉達(dá)預(yù)計(jì),到今年年底,其在印度的GPU部署將增長近10倍。
本周,在這家GPU制造商在東京舉行的人工智能峰會上,黃仁勛與軟銀董事長兼首席執(zhí)行官孫正義坐下來討論了軟銀和日本利用人工智能以及使用英偉達(dá)硬件和軟件來實(shí)現(xiàn)這一目標(biāo)的遠(yuǎn)大抱負(fù)。
據(jù)報(bào)道,日本官員希望通過寬松的監(jiān)管方式使日本對人工智能友好,從而吸引人工智能公司來到日本。黃和其他英偉達(dá)高管贊揚(yáng)了日本的創(chuàng)新歷史,以及該國廣泛的技術(shù)和人工智能技能。
英偉達(dá)電信高級副總裁Ronnie Vasishta在視頻電話中告訴記者:“日本處于這一轉(zhuǎn)型的最前沿,采用英偉達(dá)人工智能基礎(chǔ)設(shè)施的日本云計(jì)算領(lǐng)導(dǎo)者將幫助日本轉(zhuǎn)型其最重要的行業(yè),并推進(jìn)其主權(quán)人工智能的雄心。”
英偉達(dá)指出,它與許多日本公司在人工智能項(xiàng)目上有合作,但它與日本跨國公司軟銀(SoftBank)的合作占據(jù)了中心位置。軟銀將成為第一家使用英偉達(dá)的Blackwell平臺建造其第一臺超級計(jì)算機(jī),也是該國最強(qiáng)大的超級計(jì)算機(jī)公司。
該公司將使用英偉達(dá)的DGXB200系統(tǒng)作為其英偉達(dá)DGX SuperPOD超級計(jì)算機(jī)的基礎(chǔ),該計(jì)算機(jī)將用于其自己的生成式人工智能雄心,其他企業(yè)以及日本的大學(xué)和研究機(jī)構(gòu)也將能夠訪問。DGXB200系統(tǒng)于3月份首次推出,包括8個(gè)BlackwellGPU,這些GPU與供應(yīng)商的第五代NVLink互連連接,每個(gè)GPU提供1.8TB/秒的雙向吞吐量。
該平臺還包括一個(gè)專用的RAS(可靠性、可用性和可服務(wù)性)引擎和一個(gè)用于更快數(shù)據(jù)庫查詢的解壓縮引擎。根據(jù)英偉達(dá)的說法,該平臺的人工智能模型訓(xùn)練性能是其前身的3倍,推理性能是其前身的15倍。
軟銀的超級計(jì)算機(jī)還將包括英偉達(dá)的人工智能企業(yè)軟件和Quantum-2 InfiniBand網(wǎng)絡(luò),這將使大型語言模型(LLM)的開發(fā)更加容易,這些模型可以為講日語的用戶構(gòu)建,與主權(quán)人工智能的推動保持一致。
軟銀還計(jì)劃使用英偉達(dá)的Grace-Blackwell平臺制造另一臺基于英偉達(dá)的超級計(jì)算機(jī),該平臺包括其GB200NVL72液冷機(jī)架級系統(tǒng),該系統(tǒng)同時(shí)使用BlackwellGPU和基于arm的GraceCPU。該系統(tǒng)將用于高度計(jì)算密集型的工作負(fù)載。
兩家公司之間的另一個(gè)項(xiàng)目涉及軟銀和英偉達(dá)共同開發(fā)的AI-ran,這是一個(gè)同時(shí)運(yùn)行人工智能和5G工作負(fù)載的電信網(wǎng)絡(luò)。
英偉達(dá)的Vasishta說,“人工智能民主化需要建立一個(gè)全國性的人工智能基礎(chǔ)設(shè)施。需要人工智能工廠來創(chuàng)造智能,建立和培訓(xùn)服務(wù)于日本工業(yè)的新模型。不過,還需要一個(gè)傳輸網(wǎng)絡(luò)來分發(fā)智能,使人工智能推理盡可能接近端點(diǎn)。人工智能應(yīng)用程序需要通過人工智能本地端點(diǎn)來消耗智能?!?/span>
該網(wǎng)絡(luò)使用軟件定義的5G無線電堆棧,其中包括基于英偉達(dá)Aerial加速平臺的L1軟件。兩家公司在日本某地區(qū)對AI-ran網(wǎng)絡(luò)進(jìn)行了室外測試,測試了運(yùn)營商級5G性能,并對網(wǎng)絡(luò)的剩余容量進(jìn)行了AI推理工作。軟銀估計(jì),傳統(tǒng)電信網(wǎng)絡(luò)的設(shè)計(jì)初衷是處理高峰負(fù)荷,通常只使用了三分之一的容量。
軟銀表示,將整合到環(huán)境中的英偉達(dá)Aeria RAN計(jì)算機(jī)-1系統(tǒng)將比運(yùn)行傳統(tǒng)5G網(wǎng)絡(luò)的基礎(chǔ)設(shè)施節(jié)省40%的電力。孫正義在與黃仁勛表示:“有了我們緊密相連的這個(gè)智能網(wǎng)絡(luò),它將成為日本基礎(chǔ)設(shè)施智能的一個(gè)大神經(jīng)大腦?!?/span>
對于電信公司來說,它開辟了其他收入來源,因?yàn)槟軌蛟谙嗤木W(wǎng)絡(luò)上運(yùn)行這些人工智能工作負(fù)載。英偉達(dá)和軟銀都估計(jì),在新的AI-ran基礎(chǔ)設(shè)施上每投資1美元,電信公司就能從AI推理收入中獲得約5美元的回報(bào)。軟銀集團(tuán)估計(jì),每增加一臺AI-RAN服務(wù)器,它將獲得高達(dá)291%的回報(bào)。
英偉達(dá)還與GMO互聯(lián)網(wǎng)集團(tuán)、KDDI和櫻花互聯(lián)網(wǎng)等云計(jì)算公司建立了合作伙伴關(guān)系,以建立一個(gè)基于英偉達(dá)硬件和軟件的全國性人工智能基礎(chǔ)設(shè)施網(wǎng)絡(luò),推動日本機(jī)器人、醫(yī)療保健和藥物研究等領(lǐng)域的人工智能創(chuàng)新。