Meta 最近推出了其 Llama 系列的新人工智能模型 Llama 4。這次發布的模型包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth,均在大量未標記的文本、圖像和視頻數據上進行訓練,以增強其視覺理解能力。
據報導,中國 AI 實驗室 DeepSeek 的開放模型成功表現,促使 Meta 加速 Llama 的開發。Meta 被指在緊急會議中研究 DeepSeek 如何降低運行和部署模型的成本。
Scout 和 Maverick 目前可以在 Llama.com 及 Meta 的合作夥伴平台 Hugging Face 上獲得,而 Behemoth 則仍在訓練中。Meta 表示,Meta AI 已在 40 個國家更新為使用 Llama 4,然而其多模態功能目前僅限於美國的英語用戶。
部分開發者可能對 Llama 4 的授權條款表示擔憂。根據規定,歐盟用戶被禁止使用或分發該模型,這可能是因為該地區的 AI 和數據隱私法律所施加的治理要求。此外,與之前的 Llama 發布相同,擁有超過 7 億月活躍用戶的公司必須向 Meta 申請特殊許可,該許可由 Meta 自行決定是否授予。
Meta 在一篇博客中表示:“這些 Llama 4 模型標誌著 Llama 生態系統新時代的開始。這僅僅是 Llama 4 系列的開始。”
Llama 4 是 Meta 首次使用混合專家(MoE)架構的模型,這種架構在訓練和回答查詢時更具計算效率。MoE 架構將數據處理任務拆分為子任務,然後將其分配給較小的專門“專家”模型。
以下是 Llama 4 模型的主要規格:
模型 | 總參數(億) | 活躍參數(億) | 專家數量 | 硬體需求 |
---|---|---|---|---|
Llama 4 Scout | 109 | 17 | 16 | 單一 NVDIA H100 GPU |
Llama 4 Maverick | 400 | 17 | 128 | NVDIA H100 DGX 系統 |
Llama 4 Behemoth | 2000 | 288 | 16 | 更高效能的硬體需求 |
根據 Meta 的內部測試,Maverick 在某些編碼、推理、多語言、長上下文和圖像基準測試中超過了 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0。然而,Maverick 在某些方面仍不及 Google 的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5。
Scout 在文件摘要和大型代碼庫推理方面表現出色,並具備非常大的上下文窗口:可處理 1000 萬個標記。Scout 可以在單一 NVDIA H100 GPU 上運行,而 Maverick 則需要 NVDIA H100 DGX 系統。
尚未發布的 Behemoth 擁有 288 億活躍參數,並在數學問題解決等 STEM 技能的評估中超越了 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro,但未能超越 2.5 Pro。
值得注意的是,所有 Llama 4 模型並非真正的“推理”模型,這類模型能更可靠地進行答案檢查,但通常需要更長的時間來給出答案。
Meta 表示,所有 Llama 4 模型已經調整以更少地拒絕回答“有爭議”的問題,並在政治和社會話題上提供更多的回應。Meta 的發言人指出,Llama 4 能夠提供有幫助的、事實性的回應,而不帶有評判。
這些調整是在白宮盟友指責 AI 政治偏見的背景下進行的。許多特朗普總統的親信,包括 Elon Musk 和 AI 專家 David Sacks,指責 AI 聊天機器人審查保守觀點。事實上,AI 偏見是一個難以解決的技術問題,許多公司正在調整其 AI 模型以回答更多問題,特別是涉及爭議性政治主題的問題。
台灣電話卡推介 / 韓國電話卡推介
一㩒即做:香港網速測試 SpeedTest HK