Meta 推出 Llama 4 系列新人工智能模型

Meta 最近推出了其 Llama 系列的新人工智能模型 Llama 4。這次發布的模型包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth,均在大量未標記的文本、圖像和視頻數據上進行訓練,以增強其視覺理解能力。

據報導,中國 AI 實驗室 DeepSeek 的開放模型成功表現,促使 Meta 加速 Llama 的開發。Meta 被指在緊急會議中研究 DeepSeek 如何降低運行和部署模型的成本。

Scout 和 Maverick 目前可以在 Llama.com 及 Meta 的合作夥伴平台 Hugging Face 上獲得,而 Behemoth 則仍在訓練中。Meta 表示,Meta AI 已在 40 個國家更新為使用 Llama 4,然而其多模態功能目前僅限於美國的英語用戶。

部分開發者可能對 Llama 4 的授權條款表示擔憂。根據規定,歐盟用戶被禁止使用或分發該模型,這可能是因為該地區的 AI 和數據隱私法律所施加的治理要求。此外,與之前的 Llama 發布相同,擁有超過 7 億月活躍用戶的公司必須向 Meta 申請特殊許可,該許可由 Meta 自行決定是否授予。

Meta 在一篇博客中表示:“這些 Llama 4 模型標誌著 Llama 生態系統新時代的開始。這僅僅是 Llama 4 系列的開始。”

Llama 4 是 Meta 首次使用混合專家(MoE)架構的模型,這種架構在訓練和回答查詢時更具計算效率。MoE 架構將數據處理任務拆分為子任務,然後將其分配給較小的專門“專家”模型。

以下是 Llama 4 模型的主要規格:

模型 總參數(億) 活躍參數(億) 專家數量 硬體需求
Llama 4 Scout 109 17 16 單一 NVDIA H100 GPU
Llama 4 Maverick 400 17 128 NVDIA H100 DGX 系統
Llama 4 Behemoth 2000 288 16 更高效能的硬體需求

根據 Meta 的內部測試,Maverick 在某些編碼、推理、多語言、長上下文和圖像基準測試中超過了 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0。然而,Maverick 在某些方面仍不及 Google 的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5。

Scout 在文件摘要和大型代碼庫推理方面表現出色,並具備非常大的上下文窗口:可處理 1000 萬個標記。Scout 可以在單一 NVDIA H100 GPU 上運行,而 Maverick 則需要 NVDIA H100 DGX 系統。

尚未發布的 Behemoth 擁有 288 億活躍參數,並在數學問題解決等 STEM 技能的評估中超越了 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro,但未能超越 2.5 Pro。

值得注意的是,所有 Llama 4 模型並非真正的“推理”模型,這類模型能更可靠地進行答案檢查,但通常需要更長的時間來給出答案。

Meta 表示,所有 Llama 4 模型已經調整以更少地拒絕回答“有爭議”的問題,並在政治和社會話題上提供更多的回應。Meta 的發言人指出,Llama 4 能夠提供有幫助的、事實性的回應,而不帶有評判。

這些調整是在白宮盟友指責 AI 政治偏見的背景下進行的。許多特朗普總統的親信,包括 Elon Musk 和 AI 專家 David Sacks,指責 AI 聊天機器人審查保守觀點。事實上,AI 偏見是一個難以解決的技術問題,許多公司正在調整其 AI 模型以回答更多問題,特別是涉及爭議性政治主題的問題。

台灣電話卡推介 / 韓國電話卡推介

一㩒即做:香港網速測試 SpeedTest HK

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。