OpenAI新的更新將GPT-4帶給所有人,包括OpenAI的免費用戶,技術主管Mira Murati在直播活動中表示。她補充說,新的模型GPT-4o"快得多",并在文本、視頻和音頻方面有了改進的能力。OpenAI表示,最終計劃使用戶能夠通過視頻與ChatGPT進行聊天。
"這是我們在易用性方面邁出的第一大步",Murati 說道。
由微軟支持的 OpenAI 目前估值超過 800 億美元,這家公司成立于 2015 年,面臨保持在GenAI市場領先地位的壓力,同時在投入大量資金用于構建和訓練模型的處理器和基礎設施的同時,尋找賺錢的方法。
GPT-4o 中的 "o" 代表 "omni"(全能)。新的模型允許 ChatGPT 以更快的速度和更高的質量處理 50 種不同的語言,并且還將通過 OpenAI 的 API 提供,使開發(fā)人員可以從今天開始使用新模型構建應用程序,Murati 說道。
她還補充說,GPT-4o 的速度是 GPT-4 Turbo 的兩倍,成本只有一半。
OpenAI 的團隊成員展示了新模型的音頻功能,例如,要求它在公共演講前幫助安撫某人的情緒。OpenAI 研究員 Mark Chen 表示,該模型能夠 "感知你的情緒",并補充說該模型還能夠處理用戶的打斷。團隊還要求它分析用戶的面部表情,以評論這個人可能正在經歷的情緒。
“嘿,你好啊?今天我能怎么讓你高興起來呢?” 當用戶打招呼時,ChatGPT 的音頻模式這樣回答道。
根據博客文章,公司計劃在未來幾周內測試語音模式,并為 ChatGPT Plus 的付費訂閱用戶提供早期訪問權限。OpenAI 還表示,新模型可以在短至 232 毫秒、平均 320 毫秒內響應用戶的音頻提示,這與人類在對話中的反應時間相似。
Chen 演示了該模型講述睡前故事的能力,并要求它改變聲音的語調,使其更加戲劇化或機器人化。他甚至要求它唱出這個故事。
此外,OpenAI 表示,新模型甚至可以在音頻模式下作為翻譯器使用。Chen 演示了這個工具在他用英語講話的同時,能夠聽懂 Murati 說意大利語,并在他們對話時將語言翻譯成各自的語言。
團隊成員還展示了該模型解決數(shù)學方程和幫助編寫代碼的能力,使其成為微軟自己的 GitHub Copilot 的一個更強有力的競爭者。
對于 OpenAI 來說,這次發(fā)布是自今年 8 月推出 ChatGPT Enterprise(AI 聊天機器人的商業(yè)版本)以來,公司最大的一次宣布。據 OpenAI 首席運營官 Brad Lightcap 告訴記者,這個工具的開發(fā)時間不到一年,并得到了 20 多家不同規(guī)模和行業(yè)公司的幫助。
OpenAI、微軟和谷歌在GenAI的熱潮中處于領先地位,因為幾乎每個行業(yè)的公司都在競相將 AI 驅動的聊天機器人和代理添加到關鍵服務中,以避免被競爭對手甩在后面。本月早些時候,OpenAI 的競爭對手 Anthropic 宣布了其首個企業(yè)產品和一個免費的 iPhone 應用程序。
根據 PitchBook 的數(shù)據,2023 年有近 700 筆GenAI交易,總投資創(chuàng)紀錄地達到 291 億美元,比前一年增長了 260% 以上。預計市場在十年內的收入將超過 1 萬億美元。
業(yè)內一些人士對未經測試的新服務快速上市表示擔憂,學者和倫理學家對這項技術傳播偏見的傾向感到不安。
自 2022 年 11 月 ChatGPT 推出以來,它當時創(chuàng)下了歷史上消費者應用程序增長最快的記錄,現(xiàn)在大約有 1 億周活躍用戶。OpenAI 表示,超過 92% 的財富 500 強公司正在使用該平臺。
Murati 在周一的活動中表示,OpenAI 希望“消除一些技術的神秘感”。
“在接下來的幾周內,我們將向所有人推出這些功能,”她說。
根據周一的一篇博客文章,新模型將首先在周二向 ChatGPT Plus 和 Team 的客戶推出,之后再向 Enterprise 客戶推出。從周一開始,ChatGPT 的免費用戶也可以使用新模型,但有使用限制。ChatGPT Plus 的用戶將擁有比免費用戶多五倍的消息容量,而 ChatGPT Team 和 Enterprise 的客戶將有更高的使用限制。
Murati 在直播活動的最后感謝了 Nvidia 的首席執(zhí)行官 Jensen Huang 及其公司提供了必要的圖形處理單元 (GPU) 來支持 OpenAI 的技術。
“我只想感謝不可思議的 OpenAI 團隊,同時也感謝 Jensen 和 Nvidia 團隊為我們帶來了最先進的 GPU,使今天的演示成為可能,”她說。