Google 推出全新文本嵌入模型
2025年03月10日 由 alex 发表
1357
0
Google 周五在其 Gemini 开发者 API 中添加了一个全新的实验性文本“嵌入”模型 Gemini Embedding。
嵌入模型将文本输入(例如單詞和短語)轉換為數字表示形式(稱為嵌入),以捕獲文本的語義含義。嵌入用於各種應用,例如文檔檢索和分類,部分原因是它們可以降低成本並改善延遲。
競爭對手的嵌入模型
亞馬遜、Cohere 和 OpenAI 等公司都通過各自的 API 提供嵌入模型。Google 之前也提供過嵌入模型,但 Gemini Embedding 是其首個在 Gemini 系列 AI 模型上進行訓練的模型。
Google 在一篇博客文章中表示:“該嵌入模型是在 Gemini 模型上進行訓練的,它繼承了 Gemini 對語言和細微語境的理解,使其適用於廣泛的用途。” “我們已經將我們的模型訓練得非常通用,在金融、科學、法律、搜索等不同領域都表現出色。”
性能與功能提升
Google 聲稱,Gemini Embedding 的性能超越了其之前最先進的嵌入模型 text-embedding-004,並在流行的嵌入基準上取得了具有競爭力的性能。與 text-embedding-004 相比,Gemini Embedding 還可以一次接受更大的文本和代碼塊,並且支持的語言數量是其兩倍(超過 100 種)。
Google 指出,Gemini Embedding 處於“實驗階段”,容量有限,可能會發生變化。該公司在其博客文章中寫道:“我們正在努力在未來幾個月內推出穩定、普遍可用的版本。”
【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT