OpenAI 據傳即將推出 PC 控制 AI 工具 Operator

近期，有消息稱OpenAI可能即將發布一款名為Operator的AI工具，該工具能夠控制用戶的個人電腦並代為執行操作。這一信息源自軟件工程師Tibor Blaho，他因多次準確泄露即將發布的AI產品信息而聞名。

據Blaho透露，他發現了有關Operator的多個證據。此前，包括彭博社在內的多家媒體也曾報導過Operator的相關信息，稱其為一款“代理型”系統，能夠自主完成編寫代碼、預訂旅行等任務。

據知情人士透露，OpenAI計劃於今年1月發布Operator。Blaho周末發現的代碼進一步證實了這一消息。

Blaho表示，OpenAI針對macOS系統的ChatGPT客戶端中，已加入隱藏選項，用於定義“切換Operator”和“強制退出Operator”的快捷鍵。同時，OpenAI的網站上也已添加了對Operator的引用，儘管這些引用目前尚未公開。

Blaho還指出，OpenAI的網站包含了一些尚未公開的表格，對比了Operator與其他電腦使用AI系統的性能。這些表格可能僅為佔位符，但如果其中的數據準確，則表明Operator在執行某些任務時並非百分之百可靠。

在OSWorld基準測試中，一個可能是Operator所依賴的AI模型——“OpenAI電腦使用代理（CUA）”得分為38.1%，超過了Anthropic的電腦控制模型，但遠低於人類的72.4%得分。在WebVoyager測試中，OpenAI CUA的表現超過了人類，該測試評估AI導航和與網站互動的能力。然而，在另一個基於Web的基準測試WebArena中，該模型的得分低於人類水平。

如果泄露的信息屬實，Operator在執行一些對人類來說輕而易舉的任務時也會遇到困難。例如，在一項要求Operator註冊雲提供商並啟動虛擬機的測試中，其成功率僅為60%。在創建比特幣錢包的任務中，Operator的成功率更是低至10%。

OpenAI尚未對此消息置評。

隨著Anthropic、Google等競爭對手紛紛進軍這一新興領域，OpenAI即將進入AI代理市場的消息備受關注。儘管AI代理技術目前仍處於初級階段且存在風險，但科技巨頭們已將其視為AI領域的下一個重大突破。據市場分析機構預測，到2030年，AI代理市場的價值可能達到471億美元。

值得注意的是，一些專家對AI代理技術的安全性表示擔憂，尤其是在該技術迅速發展的背景下。據泄露的圖表顯示，Operator在特定安全評估中表現良好，包括試圖讓系統執行“非法活動”和搜索“敏感個人信息”的測試。據稱，安全測試是Operator開發周期較長的原因之一。OpenAI聯合創始人Wojciech Zaremba近期在一篇帖子中批評Anthropic發布了一款缺乏安全緩解措施的代理，並表示如果OpenAI發布類似產品，可能會引發負面反應。

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【教學】香港 iPhone 如何使用 Apple Intelligence！設定方法與功能 /
【教學】5 個「香港」免費使用 ChatGPT 的方法 /
【說明】4 個方法，讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

OpenAI 據傳即將推出 PC 控制 AI 工具 Operator

推薦內容

關於我們