Press Release
AMD 宣布在 MLPerf Inference 5.1 推論測試中取得佳績,其中包含首次參與的全新 AMD Instinct MI355X GPU,充分展現 AMD 在 AI 效能與效率上的顯著進展。
MLPerf 測試 AMD MI355X 成績斐然
本次測試結果亮點如下:
- 突破性的效率與效能:AMD Instinct MI355X GPU 透過全新 FP4 精度將每秒處理的 Token 數量提升 2.7 倍,以及創新的結構化剪枝 (pruned) 技術帶來高達 90% 的效能提升,在生成式AI推論中實現突破性的效率,即使是最大的AI模型也能更快、更具成本效益地部署。
- 經驗證的擴展性與靈活性:本次 MLPerf 測試結果證明了 Instinct GPU 能從單一節點無縫擴展至8節點叢集,同時也實現了領先業界的異質 GPU 推論,結合不同世代的 GPU (MI300X 和 MI325X),展現了 AMD 為不斷演進的 AI 需求打造強大且具適應性基礎設施的實力。
- 產業體系成長與效能競爭力:AMD Instinct MI325X GPU 在關鍵 AI 工作負載上展現了與競爭對手匹敵的效能,並且透過與日益壯大的合作夥伴產業體系所提交的一致性結果,進一步彰顯 Instinct 平台的生產就緒性以及 AMD ROCm 軟體的強大實力。
本次 MLPerf v5.1 測試結果,結合 AMD 與合作夥伴的緊密合作以及 AI 模型持續最佳化,彰顯 AMD 在 AI 擴展性、效能、軟體創新以及開源承諾方面的領先地位。
欲了解更多關於本次測試的詳細資訊,請參閱部落格文章,或前往 MLCommons 網站。