由 Elon Musk 領導的 xAI 最近在經過幾個月的延遲後,終於推出了其前沿的 Grok 3 AI 模型。Musk 宣稱 Grok 3 是“地球上最聰明的 AI”,並且在多個基準測試中超越了 ChatGPT。根據基準測試的結果,Grok 3 確實顯示出其為目前最強大的 AI 模型。
在訓練方面,Grok 3 在一個擁有 200K GPU 的大型集群上進行訓練,計算能力幾乎是 Grok 2 的 10 倍。至於基準測試,Grok 3 的傳統語言模型超越了 GPT-4o、Claude 3.5 Sonnet、Gemini 2.0 Pro 和 DeepSeek V3。在 AIME 2024 中,Grok 3 獲得 52% 的分數;在 GPQA Science 中,Grok 3 達到 75%;而在 LiveCodeBench 中,Grok 3 則獲得 57%。
實際上,較小的 Grok 3 mini 模型與其他最先進的模型相匹配或超越。xAI 還在 LMSYS Chatbot Arena 測試 Grok 3 模型,使用名稱“chocolate”,並且成為首個突破 1,400 Elo 分數的 AI 模型。Grok 3 現在是 Chatbot Arena 在所有類別中的第一名,無論是創意寫作、編程、數學、困難提示還是遵循指示。
至於 Grok 3 的推理模型,再次顯示出其在競爭中的優勢。Grok 3 推理模型持續超越 OpenAI 的 o3-mini-high 和完整的 o1、DeepSeek R1 以及 Gemini 2.0 Flash Thinking。即使在最新的 AIME 2025 問題集中,Grok 3 推理模型的表現也遠超其他競爭推理模型。有趣的是,Grok 3 mini 推理模型在其尺寸下也展現出相當的能力。

接下來,Elon Musk 宣布了一個新的 DeepSearch 代理,該代理能夠上網查找資料,準確地編纂信息。這個代理使用 Grok 3 推理模型。它類似於 OpenAI 的 Deep Research 代理,但瀏覽網絡、進行思考並給出答案的時間要短得多。

此外,“Think”按鈕使用 Grok 3 mini 推理模型,而“Big Brain”按鈕則使用更多的計算和思考時間來解決複雜問題,這使用了更大的 Grok 3 推理模型。Elon Musk 表示,Grok 3 將從今天開始向 X 的 Premium+ 訂閱用戶提供。如果想使用新推出的功能,可以訂閱 SuperGrok,月費為 30 美元。
日本電話卡推介 / 台灣電話卡推介
更多儲值卡評測請即睇:SIM Card 大全
https://www.techritual.com/category/sim-card-review/