AMD 董事長暨執行長蘇姿丰博士在 COMPUTEX 2024 開幕主題演講中,展現 AMD Instinct 加速器系列的強勢發展動能。AMD 揭示 AMD Instinct 加速器的跨年度產品藍圖,將逐年透過每個世代的 AMD Instinct 加速器持續挹注 AI 效能與發揮記憶體功能優勢。
AMD Instinct GPU 發展穩步向前
在更新版發展藍圖中,率先登場的是將於 2024 年第 4 季問市的全新 AMD Instinct MI325X 加速器。隨後則是 AMD Instinct MI350 系列,採用全新 AMD CDNA 打造,預計在 2025 年上市,其 AI 推論效能將比 AMD CDNA 3 架構的 AMD Instinct MI300 系列大幅提升 35 倍。AMD Instinct MI400 系列則將採用 AMD CDNA “Next” 架構,預定在 2026 年問市。
AMD 資料中心加速運算全球副總裁 Brad McCredie 表示,AMD Instinct MI300X 加速器持續受到 Microsoft Azure、Meta、戴爾科技集團、HPE、聯想等眾多合作夥伴與客戶的熱烈採納,充分反映 AMD Instinct MI300X 加速器的卓越效能與價值。在更新版年度產品藍圖的引領下,AMD 努力不懈地推動創新,提供領先各界的功能與效能,迎合 AI 產業與客戶的期盼,促進資料中心 AI 訓練與推論的新一波革新。
AMD AI 軟體產業體系日臻成熟
AMD ROCm 6 開放軟體堆疊持續發展完備,助力 AMD Instinct MI300X 加速器為當今最熱門的大型語言模型 (LLM) 挹注卓越效能。在一部配備 8 個 AMD Instinct MI300X 加速器與 ROCm 6 軟體並運行 Meta Llama-3 70B 模型的伺服器,客戶可獲得相較競爭對手產品提升 1.3 倍的推論效能以及 token 生成吞吐量。而憑藉單一 AMD Instinct MI300X 加速器與 ROCm 6 軟體,在運行 Mistral-7B 模型時,客戶可獲得相較競爭對手產品提升 1.2 倍的推論效能以及 token 生成吞吐量。AMD 亦披露最大型且最受歡迎的 AI 模型儲存庫 Hugging Face 目前每晚測試 70 萬個最熱門的模型,確保它們能在 AMD Instinct MI300X 加速器上直接運行。此外,AMD 持續拓展與上游領域的合作,包括 PyTorch、TensorFlow 以及 JAX 等熱門 AI 框架。
AMD 預覽新款加速器並公佈年度進程藍圖
AMD 在主題演講中揭示 AMD Instinct 加速器藍圖的年度進程,因應各界對運行更多 AI 運算的爆發需求。這也將確保 AMD Instinct 加速器推動新一代前沿 AI 模型的開發。更新後 AMD Instinct 年度藍圖的重點包括:
- 全新 AMD Instinct MI325X 加速器將配備 288 GB 的 HBM3E 記憶體以及每秒 6 terabytes 的記憶體頻寬,沿用和 AMD Instinct MI300 系列相同的產業標準 Universal Baseboard 伺服器設計,預計將於 2024 年第 4 季問市。這款加速器將擁有領先業界的記憶體容量與頻寬,分別比對手高 2 倍與 1.3 倍,運算效能則是比對手高 1.3 倍。
- AMD Instinct MI350 系列中率先推出的是 AMD Instinct MI350X 加速器,採用 AMD CDNA 4 架構打造,預計在 2025 年上市。新品將沿用和 MI300 系列加速器相同的產業標準 Universal Baseboard 伺服器設計,採用先進 3 奈米製程技術,支援 FP4 與 FP6 AI 資料類型,並配備 288 GB 的 HBM3E 記憶體。
- AMD CDNA “Next” 架構將打造 AMD Instinct MI400 系列加速器,預計在 2026 年上市,將提供眾多最新特色與功能,協助為推論與大規模 AI 訓練挹注額外效能與效率。
AMD 強調各界對 AMD Instinct MI300X 加速器的需求持續成長,眾多合作夥伴與客戶運用加速器運行其要求嚴苛的 AI 工作負載,其中包括:
- Microsoft Azure 運用加速器運行 Azure OpenAI 服務以及新推出的 Azure ND MI300X V5 虛擬機器。
- 戴爾科技集團運用 MI300X 加速器打造 PowerEdge XE9680 運行企業 AI 工作負載。
- 美超微 (Supermicro) 推出多款採用 AMD Instinct 加速器的解決方案。
- 聯想推出 ThinkSystem SR685a V3 為混合型 AI 創新挹注動能。
- HPE 運用加速器打造 HPE Cray XD675,加速 AI 工作負載。
歡迎至 AMD 官網瀏覽 AMD 在 COMPUTEX 發表的 AI 消息,以及前往 AMD YouTube 專頁觀看主題演講重播。