對Google的Project Astra感到好奇嗎?今天我們將探討目前我們所知的這個新多模態助手的一切。Google已全力投入AI助手的開發。在昨天的Google I/O活動中,這家科技巨頭展示了其新的多模態AI助手——Project Astra。Google的AI開發負責人Demis Hassabis希望它能成為一個在日常生活中有用的通用助手。
Project Astra旨在使用戶成為AI努力的焦點。這個助手能夠看到你的環境,識別物體,並記住你放置物品的位置——這個功能在我看來非常厲害。
但除此之外,Google的最新AI助手還能如何幫助我們呢?以下是我們目前所知的一切:
什麼是Project Astra?
從昨天活動中展示的視頻演示來看,Project Astra似乎是一個能夠看到世界並識別物體的應用程式。在視頻中,一位評論員問Astra,“告訴我當你看到發出聲音的東西時。”用戶用智能手機掃描房間。當鏡頭經過一個揚聲器時,Astra說,“我看到了一個揚聲器。”它甚至識別出揚聲器的特定部分,高音單元。
這是一項令人印象深刻的技能,顯示這個機器人不僅能與你對話,還能為你完成任務。目前,如果你想識別一個揚聲器的組件,你必須在線搜索揚聲器的圖表,並希望找到一個看起來像你的。從那裡,你還需要閱讀圖表。與實時使用Astra相比,這是一個耗時的麻煩。
多模態AI如何運作?
Project Astra遠超目前的語音助手,後者只對語音請求/命令作出音頻回應或觸發智能家居操作。根據Engadget的說法,Astra能夠立即處理視覺信息,並從一個龐大的數據庫中工作,擁有一種記憶。
Hassabis表示,加速系統是開發Astra的重中之重。如果AI助手延遲,它就沒什麼幫助。因此,團隊加速了模塊並改進了基礎設施。
AI助手能做什麼?
識別揚聲器的部分是一個很酷的技巧。但一個真正有用的AI助手應該不止於此。現在,即使是Google也不確定這個助手將如何工作或如何融入你的生活。目前,DeepMind團隊仍在研究如何以最佳方式將不同的多模態模型結合起來。
然而,根據The Verge的說法,旅行計劃是Google目前正在探索的一個潛在用途。一個新工具使用Google的大型語言模型Gemini來創建一個你可以編輯和修改的行程。
Hassabis還對在智能眼鏡和智能手機中使用AI代理充滿熱情。因此,也許你的下一副Google智能眼鏡會在你出門前提醒你鑰匙放在哪裡。
評論者對Project Astra的看法是什麼?
來自Engadget的評論者認為Project Astra需要一些時間。在一次演示中,評論者請AI助手講述桌子上的物品的故事。雖然這個故事很有創意和有趣,但他們認為這是一個更適合兒童的功能,而不是能讓人們生活更輕鬆的功能。
Astra能夠識別一位評論者的衣服並記住他把太陽鏡放在哪裡。這些物品並不是演示的一部分,所以這項技術很先進,有潛力節省時間和減少壓力。
然而,還有很多工作要做。評論者指出,Astra是基於雲的,無法在設備上運行。此外,它對物體的“記憶”僅持續一個會話。如果要在我的家中工作,它需要至少記住物品的位置一週。
Project Astra的未來會怎樣?
目前,Google沒有計劃推出Project Astra。它仍處於開發的早期階段。前面提到Hassabis喜歡將Astra的功能整合到眼鏡和移動設備中,所以也許我們會在那裡體驗到它。但目前,這個項目僅供內部學習使用。
如果有什麼的話,Project Astra展示了AI開發在短時間內取得的進展。一年前,我們還在實驗大型語言模型機器人在工作和日常生活中的應用。現在,一個AI助手可以記住我們在房間裡放置物品的位置。這是一個巨大的飛躍。
總結
總的來說,Project Astra的功能需要時間來完全開發。然而,這個項目將幫助DeepMind團隊更多地了解AI及其潛在用途。這樣,它可以以更有針對性的方式引導開發,並更好地回答AI如何最好地改善人們生活的問題。