亞馬遜在 2024 年 AWS re:Invent 活動上推出了其首個系列的基礎 AI 模型,雖然稍晚,但仍引起了廣泛關注。亞馬遜開發了一個名為 Nova 的 AI 模型系列,旨在與 OpenAI 的 GPT-4o、Google 的 Gemini 1.5 Pro 以及其合作夥伴 Anthropic 的 Claude 3.5 Sonnet (New) 模型競爭。
Nova 系列下共有六個模型:Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas 和 Nova Reel。
Nova Micro 是最小的文本專用模型;Nova Lite 是一款低成本的多模態模型,能夠處理圖像、視頻和文本;Nova Pro 是一款功能強大的多模態模型;Nova Premier 是專為複雜推理任務設計的最強模型(預計於 2025 年第一季度推出);Nova Canvas 能生成 AI 圖像,而 Nova Reel 則可製作 AI 視頻。
總的來說,透過 Nova AI 模型,亞馬遜已經涵蓋了生成式 AI 的所有應用場景。這些 Nova 模型將通過 Amazon Bedrock 的 API 提供給開發者和商業客戶,以支持新的 AI 體驗和應用。
令人驚訝的是,亞馬遜在其自有的 Trainium 晶片上訓練 Nova 模型,推理則在其 Inferentia 晶片上進行。顯然,亞馬遜並未依賴 Nvidia 的 GPU 來訓練其基礎模型,這一點與 Google 的 TPU 類似。
亞馬遜計劃通過 Rufus 在購物應用和語音助手 Alexa 中引入 Nova 驅動的 AI 體驗。至於基準測試,亞馬遜的 Nova Pro 模型在性能上不及 Claude 3.5 Sonnet (New) 和 GPT-4o 等旗艦模型,但其競爭力仍然相當強勁。可以參考上表以了解基準數字。
亞馬遜表示,其最強大的 Nova Premier 模型將於 2025 年第一季度推出。此外,客戶還可以根據其專有數據對模型進行微調。