近期,有消息稱OpenAI可能即將發布一款名為Operator的AI工具,該工具能夠控制用戶的個人電腦並代為執行操作。這一信息源自軟件工程師Tibor Blaho,他因多次準確泄露即將發布的AI產品信息而聞名。
據Blaho透露,他發現了有關Operator的多個證據。此前,包括彭博社在內的多家媒體也曾報導過Operator的相關信息,稱其為一款“代理型”系統,能夠自主完成編寫代碼、預訂旅行等任務。
據知情人士透露,OpenAI計劃於今年1月發布Operator。Blaho周末發現的代碼進一步證實了這一消息。
Blaho表示,OpenAI針對macOS系統的ChatGPT客戶端中,已加入隱藏選項,用於定義“切換Operator”和“強制退出Operator”的快捷鍵。同時,OpenAI的網站上也已添加了對Operator的引用,儘管這些引用目前尚未公開。
Blaho還指出,OpenAI的網站包含了一些尚未公開的表格,對比了Operator與其他電腦使用AI系統的性能。這些表格可能僅為佔位符,但如果其中的數據準確,則表明Operator在執行某些任務時並非百分之百可靠。
在OSWorld基準測試中,一個可能是Operator所依賴的AI模型——“OpenAI電腦使用代理(CUA)”得分為38.1%,超過了Anthropic的電腦控制模型,但遠低於人類的72.4%得分。在WebVoyager測試中,OpenAI CUA的表現超過了人類,該測試評估AI導航和與網站互動的能力。然而,在另一個基於Web的基準測試WebArena中,該模型的得分低於人類水平。
如果泄露的信息屬實,Operator在執行一些對人類來說輕而易舉的任務時也會遇到困難。例如,在一項要求Operator註冊雲提供商並啟動虛擬機的測試中,其成功率僅為60%。在創建比特幣錢包的任務中,Operator的成功率更是低至10%。
OpenAI尚未對此消息置評。
隨著Anthropic、Google等競爭對手紛紛進軍這一新興領域,OpenAI即將進入AI代理市場的消息備受關注。儘管AI代理技術目前仍處於初級階段且存在風險,但科技巨頭們已將其視為AI領域的下一個重大突破。據市場分析機構預測,到2030年,AI代理市場的價值可能達到471億美元。
值得注意的是,一些專家對AI代理技術的安全性表示擔憂,尤其是在該技術迅速發展的背景下。據泄露的圖表顯示,Operator在特定安全評估中表現良好,包括試圖讓系統執行“非法活動”和搜索“敏感個人信息”的測試。據稱,安全測試是Operator開發周期較長的原因之一。OpenAI聯合創始人Wojciech Zaremba近期在一篇帖子中批評Anthropic發布了一款缺乏安全緩解措施的代理,並表示如果OpenAI發布類似產品,可能會引發負面反應。
【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【教學】香港 iPhone 如何使用 Apple Intelligence!設定方法與功能 /
【教學】5 個「香港」免費使用 ChatGPT 的方法 /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT