Google 推出最強文本嵌入模型:Gemini Embedding 的全新面貌

Google 推出全新文本嵌入模型

2025年03月10日 由 alex 发表
1357
0

Google 周五在其 Gemini 开发者 API 中添加了一个全新的实验性文本“嵌入”模型 Gemini Embedding。

嵌入模型将文本输入(例如單詞和短語)轉換為數字表示形式(稱為嵌入),以捕獲文本的語義含義。嵌入用於各種應用,例如文檔檢索和分類,部分原因是它們可以降低成本並改善延遲。

競爭對手的嵌入模型

亞馬遜、Cohere 和 OpenAI 等公司都通過各自的 API 提供嵌入模型。Google 之前也提供過嵌入模型,但 Gemini Embedding 是其首個在 Gemini 系列 AI 模型上進行訓練的模型。

Google 在一篇博客文章中表示:“該嵌入模型是在 Gemini 模型上進行訓練的,它繼承了 Gemini 對語言和細微語境的理解,使其適用於廣泛的用途。” “我們已經將我們的模型訓練得非常通用,在金融、科學、法律、搜索等不同領域都表現出色。”

性能與功能提升

Google 聲稱,Gemini Embedding 的性能超越了其之前最先進的嵌入模型 text-embedding-004,並在流行的嵌入基準上取得了具有競爭力的性能。與 text-embedding-004 相比,Gemini Embedding 還可以一次接受更大的文本和代碼塊,並且支持的語言數量是其兩倍(超過 100 種)。

Google 指出,Gemini Embedding 處於“實驗階段”,容量有限,可能會發生變化。該公司在其博客文章中寫道:“我們正在努力在未來幾個月內推出穩定、普遍可用的版本。”

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。