當 OpenAI 將 ChatGPT 連接到互聯網時,它大大提升了 AI 聊天機器人的能力。現在,搜索引擎 You.com 希望為每個大型語言模型(LLM)做同樣的事情。
You.com 今天宣布推出一組 API,旨在為像 Meta 的 Llama 2 這樣的 LLM 提供實時訪問開放網絡的能力,或者是其中的一部分。You.com 的 API 從每月 100 美元起,增強了 LLM 對用戶問題的回答(例如「本週有哪些節日?」),並提供來自互聯網的最新背景信息。
包括 LlamaIndex、Anthropic 和 Cohere 在內的客戶已經將其與其模型集成在一起。
You.com 的首席執行官兼創始人 Richard Socher 在一封電子郵件訪談中告訴 TechCrunch:“我們收到了許多對具有這些功能的 API 的請求。”「當您詢問有關最近事件的問題,例如超級碗的比分,我們的 API 將在網絡上搜索該比分,然後您可以將那個信息即時添加到 LLM 中,以更準確地回答您的問題。」
大多數 LLM 都是通過從公共網頁、電子書和其他地方抓取的公開可用的靜態數據進行訓練。這足以使它們執行各種任務,從撰寫電子郵件到起草求職信和文章。但這限制了 LLM 對數據時間範圍的了解;在 2021 年 9 月之前訓練的 LLM 當然不會知道昨天發生的事件。
You.com 的新 API 通過創建網站長片段索引來克服此限制,這是與 Bing 和 Google 提供的標準搜索 API 有所不同的關鍵點。Socher 聲稱,Bing 和 Google 的搜索 API 僅提供非常短的片段,旨在引誘用戶點擊鏈接。當回答問題時,LLM 可以利用這個自定義的索引,識別相關的片段並對其進行總結,以提供更新的答案。
Socher 解釋說:“每個 LLM 都有一個提示,即描述其行為和回答問題的方式。”「您可以在提示的末尾添加自己的問題,與 LLM 進行對話。這個 API 的功能是,您可以在問題被問出之後,將來自網絡的許多最新背景信息添加到提示中。」
You.com 在推出時提供了三種 API:“網絡搜索”、“新聞”和“RAG”。網絡搜索使 LLM 可以訪問前面提到的長片段索引,而「新聞」則僅提供新聞結果。至於「RAG」(「retrieval-augmented generation」),它將 You.com 的網絡搜索結果與 LLM 配對,生成 Socher 聲稱的「更有事實依據」的回答,儘管這還有待審議。
現在,具有網絡訪問功能的 LLM 可能存在風險,無論它使用的是哪些 API。現實世界的網絡比靜態訓練數據集更少經過精選,因此也更少經過過濾。搜索結果可能受到操縱,並且它們也不一定代表整個網絡的全部。由於大多數算法優先考慮使用現代網絡技術(如加密、移動支持和模式標記)的網站,具有優質內容的網站可能在其中被忽略。
Socher 承認,You.com 的 API 在本地化的「附近」風格問題(例如「附近有哪些好的壽司店?」)方面存在弱點,因為 API 不知道 LLM 用戶的位置。但已經在進行改進,包括升級,允許 You.com 的 API 編寫並「生成更複雜的答案」,並帶有可追溯的引用,Socher 表示。
他補充說:“我們將很快將新聞和一般網絡搜索合併在一起,以便使用我們的 API 的公司更加方便。”「通過將我們的 API 納入創作者所建立的任何解決方案中,他們的答案將對他們的最終用戶更加相關和有幫助…(解決方案可以)查證事實。」
這些新的 API 讓筆者想知道搜索是否是生成式 AI 領域的下一個戰場。隨著開源 LLM 接近某些專有 LLM 的水平,支持這些專有 LLM 的搜索引擎的強大優勢(ChatGPT 的情況下是 Bing,Bard 的情況下是 Google)成為一個更有競爭力的賣點,除非像 You.com 的 API 有效地使競爭更加公平。
這是一個很大的「如果」——沒有 API 是完美的,You.com 的 API 肯定有 Socher 未提及的缺陷。但我認為競爭總是一件好事。
新的 You.com API 在 60 天試用期後,每月 100 美元起,可提供 14,200 次 API 調用,試用期還附帶 1,000 次免費每月調用。You.com 還提供定制方案,用於更大型的企業交易,包括年度訂閱和折扣。