Meta 推出 Llama 4 系列新人工智能模型

Meta 最近推出了其 Llama 系列的新人工智能模型 Llama 4。這次發布的模型包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth，均在大量未標記的文本、圖像和視頻數據上進行訓練，以增強其視覺理解能力。

據報導，中國 AI 實驗室 DeepSeek 的開放模型成功表現，促使 Meta 加速 Llama 的開發。Meta 被指在緊急會議中研究 DeepSeek 如何降低運行和部署模型的成本。

Scout 和 Maverick 目前可以在 Llama.com 及 Meta 的合作夥伴平台 Hugging Face 上獲得，而 Behemoth 則仍在訓練中。Meta 表示，Meta AI 已在 40 個國家更新為使用 Llama 4，然而其多模態功能目前僅限於美國的英語用戶。

部分開發者可能對 Llama 4 的授權條款表示擔憂。根據規定，歐盟用戶被禁止使用或分發該模型，這可能是因為該地區的 AI 和數據隱私法律所施加的治理要求。此外，與之前的 Llama 發布相同，擁有超過 7 億月活躍用戶的公司必須向 Meta 申請特殊許可，該許可由 Meta 自行決定是否授予。

Meta 在一篇博客中表示：“這些 Llama 4 模型標誌著 Llama 生態系統新時代的開始。這僅僅是 Llama 4 系列的開始。”

Llama 4 是 Meta 首次使用混合專家（MoE）架構的模型，這種架構在訓練和回答查詢時更具計算效率。MoE 架構將數據處理任務拆分為子任務，然後將其分配給較小的專門“專家”模型。

以下是 Llama 4 模型的主要規格：

模型	總參數（億）	活躍參數（億）	專家數量	硬體需求
Llama 4 Scout	109	17	16	單一 NVDIA H100 GPU
Llama 4 Maverick	400	17	128	NVDIA H100 DGX 系統
Llama 4 Behemoth	2000	288	16	更高效能的硬體需求

根據 Meta 的內部測試，Maverick 在某些編碼、推理、多語言、長上下文和圖像基準測試中超過了 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0。然而，Maverick 在某些方面仍不及 Google 的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5。

Scout 在文件摘要和大型代碼庫推理方面表現出色，並具備非常大的上下文窗口：可處理 1000 萬個標記。Scout 可以在單一 NVDIA H100 GPU 上運行，而 Maverick 則需要 NVDIA H100 DGX 系統。

尚未發布的 Behemoth 擁有 288 億活躍參數，並在數學問題解決等 STEM 技能的評估中超越了 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro，但未能超越 2.5 Pro。

值得注意的是，所有 Llama 4 模型並非真正的“推理”模型，這類模型能更可靠地進行答案檢查，但通常需要更長的時間來給出答案。

Meta 表示，所有 Llama 4 模型已經調整以更少地拒絕回答“有爭議”的問題，並在政治和社會話題上提供更多的回應。Meta 的發言人指出，Llama 4 能夠提供有幫助的、事實性的回應，而不帶有評判。

這些調整是在白宮盟友指責 AI 政治偏見的背景下進行的。許多特朗普總統的親信，包括 Elon Musk 和 AI 專家 David Sacks，指責 AI 聊天機器人審查保守觀點。事實上，AI 偏見是一個難以解決的技術問題，許多公司正在調整其 AI 模型以回答更多問題，特別是涉及爭議性政治主題的問題。

台灣電話卡推介 / 韓國電話卡推介

一㩒即做：香港網速測試 SpeedTest HK

Meta 推出 Llama 4 系列新人工智能模型

推薦內容

關於我們