AMD 今日發表全新 AMD Instinct MI200 系列加速器,為首款 exascale 等級的 GPU 加速器。AMD Instinct MI200 系列加速器中的 AMD Instinct MI250X 為全球最快的高效能運算(HPC)與人工智慧(AI)加速器。
AMD Instinct MI200 系列加速器是資料中心運算首選加速器
AMD Instinct MI20 0系列加速器基於 AMD CDNA 2 架構打造,可為廣泛的 HPC 工作負載提供領先的應用效能註2。在雙精度(FP64)HPC 應用中,AMD Instinct MI250X 加速器提供比競爭對手加速器高達 4.9 倍的效能提升,並為 AI 工作負載提供超過 380 teraflops 的半精度(FP16)尖峰理論效能,以強大的效能進一步加速資料導向的研究。
AMD 全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理 Forrest Norrod 表示,AMD Instinct MI200 加速器提供了領先的 HPC 與 AI 效能,協助科學家在研究工作中實現跨世代的進展,大幅縮短從最初假設到實際印證的時間。憑藉在架構、封裝以及系統設計方面的關鍵性創新,AMD Instinct MI200 系列加速器為有史以來最先進的資料中心 GPU,為超級電腦與資料中心挹注卓越效能,以解決全球最複雜的難題。
AMD 引領 Exascale 時代
AMD 與美國能源部、橡樹嶺國家實驗室以及 HPE 聯手設計 Frontier 超級電腦,預計可提供超過 1.5 exaflops 的尖峰運算效能。搭載優化的 AMD 第 3 代 EPYC CPU 與 AMD Instinct MI250X 加速器,Frontier 將透過大幅提升的 AI、分析、大規模模擬效能,推動科學探索的發展,協助科學家完成更多計算、從資料洞悉出新模式,並開發創新的資料分析方法,從而加快科學發現的步伐。
橡樹嶺國家實驗室總監 Thomas Zacharia 表示,Frontier 超級電腦是 AMD、HPE 以及美國能源部緊密合作的結晶,旨在提供具有 exascale 等級運算能力的系統,透過大幅提升人工智慧、分析、大規模模擬的效能,推動科學探索的發展。
推動 HPC 的未來發展
AMD Instinct MI200 系列加速器搭配 AMD 第 3 代 EPYC CPU 與 ROCm 5.0 開放軟體平台,旨在推動 exascale 等級時代的新發現,並解決從氣候變遷到疫苗研究等最迫切的挑戰。
AMD Instinct MI200 系列加速器的關鍵功能與特色包括:
- AMD CDNA 2 架構-第 2 代 Matrix Cores 加速的 FP64 與 FP32 矩陣運算,帶來比 AMD 前一代 GPU 高達 4 倍的 FP64 尖峰理論效能提升。
- 領先的封裝技術-業界首款採用多晶片(multi-die)GPU 設計與 2.5D Elevated Fanout Bridge 技術(EFB),與 AMD 前一代 GPU 相比,可提供 1.8 倍的核心數以及 2.7 倍的記憶體頻寬,帶來業界最佳的聚合尖峰理論記憶體頻寬,每秒達到 3.2 terabytes。
- AMD 第 3 代 Infinity Fabric 技術-多達 8 個 Infinity Fabric 通道將 AMD Instinct MI200 與節點中的第 3 代 EPYC CPU 和其他 GPU 連結,實現統一 CPU / GPU 記憶體的一致性,達到最高的系統吞吐量,藉由加速器的強大效能讓 CPU 程式碼更簡化。
專為 Exascale 等級科學研發打造的軟體
AMD ROCm 為開放軟體平台,讓研究人員能發揮 AMD Instinct 加速器的強大效能,推動科學探索。ROCm 平台基於開放可攜性的基礎,支援各加速器供應商與各種架構環境。AMD 藉由 ROCm 5.0 拓展其開放平台,透過 AMD Instinct MI200 系列加速器支援頂尖 HPC 與 AI 應用,為開發者增進 ROCm 的可及性,並在關鍵工作負載中提供卓越效能。
藉由 AMD Infinity Hub,研究人員、資料科學家和終端使用者可以輕鬆地搜尋、下載並安裝在 AMD Instinct 加速器和 ROCm 上優化和支援的容器化 HPC 應用與機器學習(ML)框架。AMD Infinity Hub 目前提供眾多容器,支援 Radeon Instinct MI50、AMD Instinct MI100 與 AMD Instinct MI200 加速器,Chroma、CP2k、LAMMPS、NAMD、OpenMM 等多種應用,以及 TensorFlow 和 PyTorch 等熱門 ML 框架。AMD Infinity Hub 也持續在增加新容器。
現有的伺服器解決方案
AMD Instinct MI250X 和 AMD Instinct MI250 目前以開放硬體運算加速器模組或 OCP 加速器模組(OAM)的規格供貨。AMD Instinct MI210 將以 PCIe 介面卡規格搭載於 OEM 伺服器。
AMD Instinct MI250X 加速器目前搭載於 HPE 的 HPE Cray EX 超級電腦,更多 AMD Instinct MI200 系列加速器預計將從 2022 年第 1 季開始搭載於各大 OEM 與 ODM 夥伴廠商的企業系統,包括華碩、ATOS、戴爾科技集團、技嘉、HPE、聯想、Penguin Computing 以及美超微(Supermicro)。