微軟Copilot正日益智能化,這家由薩蒂亞·納德拉領(lǐng)導(dǎo)的公司剛剛宣布,其AI助手現(xiàn)已具備“視覺”功能,能夠與用戶一起瀏覽互聯(lián)網(wǎng)。
雖然該功能在今年10月就已首次宣布,但公司目前正面向部分Pro訂閱用戶進(jìn)行預(yù)覽。據(jù)微軟介紹,這些用戶將能夠在其Edge瀏覽器上打開的網(wǎng)頁上觸發(fā)Copilot Vision,并就屏幕上可見的內(nèi)容與其進(jìn)行交互。
該功能仍處于開發(fā)的早期階段,且相當(dāng)受限,但一旦完全成熟,對(duì)微軟的企業(yè)客戶而言將可能是一個(gè)顛覆性的改變——它將在客戶與微軟生態(tài)系統(tǒng)中的產(chǎn)品(如OneDrive、Excel、SharePoint等)互動(dòng)時(shí),幫助他們進(jìn)行分析和決策。
從長遠(yuǎn)來看,觀察Copilot Vision如何與更加開放且功能強(qiáng)大的代理式產(chǎn)品(如Anthropic和Emergence AI的產(chǎn)品)相抗衡也將頗有趣味。這些產(chǎn)品允許開發(fā)者整合代理,以跨不同供應(yīng)商的應(yīng)用程序進(jìn)行查看、推理和采取行動(dòng)。
Copilot Vision能帶來什么?
當(dāng)用戶打開一個(gè)網(wǎng)站時(shí),他們可能有一個(gè)明確的目標(biāo),也可能沒有,但是,當(dāng)他們有目標(biāo)時(shí),比如為學(xué)術(shù)論文進(jìn)行研究,執(zhí)行所需任務(wù)的過程就包括瀏覽網(wǎng)站、閱讀所有內(nèi)容,然后做出決定(比如是否將網(wǎng)站內(nèi)容作為論文的參考),同樣的道理也適用于其他日常網(wǎng)絡(luò)任務(wù),如購物。
通過全新的Copilot Vision體驗(yàn),微軟旨在簡(jiǎn)化整個(gè)流程。本質(zhì)上,用戶現(xiàn)在擁有了一個(gè)助手,它位于瀏覽器的底部,可以隨時(shí)被調(diào)用以閱讀網(wǎng)站內(nèi)容,包括所有文本和圖像,并幫助用戶進(jìn)行決策。
它能夠立即掃描、分析并提供所有所需信息,同時(shí)考慮到用戶的既定目標(biāo)——就像另一雙眼睛一樣。
這一功能具有深遠(yuǎn)的好處——它可以極大地加速你的工作流程——同時(shí)考慮到代理正在閱讀和評(píng)估你瀏覽的所有內(nèi)容,它也具有重大影響,然而,微軟已保證,一旦Vision會(huì)話關(guān)閉,用戶共享的所有上下文和信息都將被刪除。它還指出,網(wǎng)站數(shù)據(jù)不會(huì)被捕獲/存儲(chǔ)用于訓(xùn)練底層模型。
“簡(jiǎn)而言之,我們優(yōu)先考慮版權(quán)、創(chuàng)作者以及我們用戶的隱私和安全——并將它們置于首位?!盋opilot團(tuán)隊(duì)在宣布該功能預(yù)覽的博客文章中寫道。
基于反饋進(jìn)行擴(kuò)展
目前,美國已報(bào)名參加早期訪問Copilot Labs計(jì)劃的部分Copilot Pro訂閱用戶將能夠在其Edge瀏覽器中使用視覺功能。該功能為可選加入,這意味著用戶不必?fù)?dān)心AI一直在讀取他們的屏幕。
此外,在這一階段,該功能將僅適用于部分網(wǎng)站。微軟表示,它將根據(jù)早期用戶的反饋逐步改進(jìn)該功能,并擴(kuò)大對(duì)更多Pro用戶和其他網(wǎng)站的支持。
從長遠(yuǎn)來看,該公司甚至可能將這些功能擴(kuò)展到其生態(tài)系統(tǒng)中的其他產(chǎn)品,如OneDrive和Excel,從而讓企業(yè)用戶能夠更輕松地工作和做出決策,然而,目前尚無官方確認(rèn)。更不用說,鑒于此處所表明的謹(jǐn)慎態(tài)度,這可能需要一些時(shí)間才能實(shí)現(xiàn)。
微軟推出Copilot Vision預(yù)覽之際,正是競(jìng)爭(zhēng)對(duì)手在代理式AI領(lǐng)域不斷提高標(biāo)準(zhǔn)之時(shí)。Salesforce已在其Customer 360產(chǎn)品中推出了AgentForce,以實(shí)現(xiàn)跨銷售、營銷和服務(wù)等領(lǐng)域的工作流程自動(dòng)化。
與此同時(shí),Anthropic推出了“Computer Use”,允許開發(fā)者整合Claude以與計(jì)算機(jī)桌面環(huán)境進(jìn)行交互,執(zhí)行以前僅由人類工作者處理的任務(wù),如打開應(yīng)用程序、與界面互動(dòng)和填寫表單。