Google 最近發佈了 Gemini 2.5,這是一個重大的升級,被稱為其「最智能的 AI 模型」。在公司的博客中,Google 揭示了實驗版本的 2.5 Pro,目前已向所有 Gemini 高級訂閱用戶開放。未來還將推出更多 2.5 模型。
Gemini 2.5 模型代表了一種新一代思考模型,透過顯著增強的基礎模型和改進的後期訓練,達到了「新的性能水平」。這些思考能力將應用於所有未來的 Google AI 模型,這將使其能夠「處理更複雜的問題,支持更強大的上下文感知代理」。
目前,Gemini 2.5 Pro 實驗版可通過在 Gemini 應用中選擇該模型或直接在 Google 的 AI Studio 中訪問。需要擁有 Gemini 高級訂閱才能看到這個選項。針對希望將其用於大規模生產用途的改進模型的定價將在未來幾周內公佈,並預計將推出更多 2.5 模型。
Google 分享了 Gemini 2.5 Pro 實驗版的一些基準測試結果,顯示出相當驚人的表現。該 AI 模型在 Humanity’s Last Exam 中得分為 18.8%,而 ChatGPT 的 o3-mini 得分為 14%,DeepSeek R1 則為 8.6%。Humanity’s Last Exam 是最全面和困難的 AI 基準測試,因此能夠顯著高於競爭對手的得分實屬不易。18.8% 的得分是迄今為止在 Humanity’s Last Exam 中獲得的最高分(不使用工具)。Google 將 Gemini 2.5 Pro 的推理能力稱為「尖端技術」,這一點顯而易見。
Google 在 AI 發展方面持續快速推進。就在上周,該公司將 Gemini Deep Research 免費提供給所有用戶,並隨後對其出色的 AI 播客工具 NotebookLM 進行了改進。未來將對 Gemini 2.5 Pro 進行測試,並對新的實驗模型進行評估,將持續關注 Google AI 的最新動態。
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT