Intel 推出 Gaudi3 處理器,具備內建記憶體的 AI 加速器,挑戰 H100 這款最佳顯示卡。Gaudi3 是一款 5nm 製程的處理器,為 7nm 深度學習訓練處理器 Gaudi2 的後繼產品。據 Serve the Home 報導,Gaudi3 的腦部浮點運算能力是 BF16 的四倍,網絡能力是兩倍,頻寬則是高頻寬記憶體的 1.5 倍。
預計 Gaudi3 將於 2024 年推出,據該報導估計,該處理器將搭載高達 128GB 的 HBM3e RAM,相較於前代的 96GB HBM2e 內建記憶體,這將帶來顯著的 AI 學習和訓練性能提升。
這實際上是 Intel 對 GH200 超級芯片的回應,後者搭載了 141GB 的 HBM3e 記憶體,是 Nvidia 最新顯示卡的陪伴者。由於 Gaudi2 的性能與 H100 相近,Gaudi3 很可能在性能水平上與 H200 相當。Intel 在展示其 Gaudi3 晶片的能力時,同時展示了搭載在全新 Aurora 超級計算機中的 Intel Max 系列 1550 顯示卡。這是第二台 exascale 超級計算機,一旦完全調校,很可能成為有史以來最強大的計算機。
預計它在性能上將超越 Frontier 超級計算機,達到高達 2 exaFLOPs 的水平,即每秒約兩千億億次計算。根據該公司的說法,相較於搭載 AMD 和 Nvidia 顯示卡的可比系統,它在處理 AI 訓練工作負載方面具有更強大的能力。
在 CosmicTagger 單 GPU 訓練吞吐量基準測試中,Intel Max 1550 GPU 的得分為 48.4 samples per second,而 AMD 的 MI250 和 Nvidia 的 A100 則分別為 31.2 和 14.7。在 CosmicTagger 單節點訓練基準測試中,Intel 的 GPU 的得分為 280 samples per second,而 AMD 和 Nvidia 的 GPU 則分別為 120 和 54.9。
雖然目前沒有 Nvidia 的 H100 或 H200 顯示卡的可比基準測試數據,但這些結果使得 Intel Max 1550 成為運行 AI 訓練和推理工作負載的非常出色的選擇。