Google 發佈具成本效益的 Gemini 2.5 Flash AI 模型,目前正在預覽中,並可在 Gemini 應用程式中免費使用。開發者可以開始在 AI Studio 和 Vertex AI 上使用 API。Google 表示,Gemini 2.5 Flash 是該公司“首個完全混合推理模型”。
這意味著它同時是一個傳統的 LLM 和一個推理/思考的 AI 模型。Google 表示,開發者可以開啟或關閉思考功能,並分配思考預算。該 AI 模型經過優化,以實現成本、質量和延遲之間的平衡,提供快速性能和高質量輸出的同時降低成本。雖然 Gemini 2.5 Pro 提供最佳性能,但 Gemini 2.5 Flash 的設計考慮了經濟實惠。

在基準測試方面,Gemini 2.5 Flash 的排名略低於 OpenAI 最新的 o4-mini 推理模型。在 Humanity’s Last Exam 中,Gemini 2.5 Flash 得分 12.1%,而 o4-mini 得分 14.3%。在 GPQA Diamond 中,Gemini 2.5 Flash 達到 78.3%,而 o4-mini 略好,得分 81.4%。同樣,在 AIME 2025 中,Gemini 2.5 Flash 得到 78%,而 o4-mini 則達到 92.7%。
Gemini 2.5 Flash 的真正價值在於其經濟實惠的定價。其輸入/輸出成本為 $0.15/$0.60(非推理),推理 API 調用則為 $3.50。此外,Gemini 2.5 Flash 還與 Gemini 應用程式中的新功能如 Canvas 兼容。
日本電話卡推介 / 韓國電話卡推介
一㩒即做:香港網速測試 SpeedTest HK