Google 正在為 Gemini Live 推出新的視覺功能,讓這款 AI 助手能夠「看見」手機螢幕或鏡頭的內容。這些升級是由 Google 的 AI 研究與發展計劃 Project Astra 支持的。
Gemini Live 現在具備了視覺能力,Google 靜悄悄地開始推出這些功能,將普通的智能手機轉變為 AI 助手的全視之眼。這些新功能由一位 Reddit 用戶發現,並分享了演示視頻。升級後,Gemini 能夠透過螢幕或鏡頭分析所見的內容,這次推出標誌著 Google 頗受關注的 Project Astra 的首次亮相。
根據視頻,Gemini 的「眼睛」可以通過「與 Live 分享螢幕」按鈕實時分析螢幕內容。Gemini 之前已能處理靜態截圖,但這次更新則持續關注螢幕上的內容,無論是好是壞。另一項功能則使手機的鏡頭成為 Gemini 的眼睛。Google 已演示該 AI 能夠準確辨識顏色和物體,但最終產品是否能達到演示的理想效果尚不明朗。
這項新功能首先向每月支付 $20(約 HK$ 156)以獲得額外 AI 服務的 Gemini 高級訂閱用戶推出。根據 Reddit 用戶展示的 Xiaomi 手機,這次推出的範圍相當廣泛。Google 之前曾暗示,Pixel 和 Galaxy S25 的用戶將能更快或更好地訪問 Project Astra。
雖然市場上存在其他具類似視覺工具的 AI 助手,但多數與第三方應用程序如 Microsoft Copilot、ChatGPT、Grok 及 Hugging Face 的新應用 HuggingSnap 相關聯。將實時螢幕和相機連接的 AI 整合到 Android 系統中,無疑會吸引有興趣的用戶嘗試 Gemini。
Google 在推出此功能的時機上顯得尤為重要,因為它正試圖在 AI 助手領域中佔據優勢。儘管 Amazon 正在宣傳其新版本的「Alexa Plus」,但該更新尚未推出。同時,Apple 的 Siri 升級也多次延遲,這使得 Google 在 AI 助手競爭中暫時佔據了一定的先機。儘管 Gemini 在早期階段經歷了一些波折和品牌重塑(RIP Bard),但目前它所提供的功能是 Alexa 和 Siri 所無法比擬的。
Google 承諾 Project Astra 將成為「下一代助手」,希望能成為人們日常使用的首選。未來幾周,新的功能預計將陸續推出,值得持續關注。
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT