於美國達拉斯舉行的 Supercomputing 2022 (SC22) 前夕,英特爾隆重推出 Intel Max 系列產品,包含兩款用於高效能運算 (HPC) 和人工智慧 (AI) 的尖端產品:代號 Sapphire Rapids HBM 的 Intel Xeon CPU Max 系列以及代號 Ponte Vecchio 的 Intel Data Center GPU Max 系列。為阿貢國家實驗室即將推出的 Aurora 超級電腦提供充沛運算性能,並公開其部署的最新情況。
用於 HPC 的 Intel Max 系列產品正式推出
Xeon Max CPU 是首款也是唯一一款具備高頻寬記憶體的 x86 處理器,不需要修改程式碼,即可加速許多的 HPC 工作負載。Max 系列 GPU 是英特爾密度最高的處理器,將超過千億個電晶體以 47 個晶片塊的方式整合至單一封裝,具備高達 128GB 高頻寬記憶體。oneAPI 開放式軟體生態系為這兩款處理器系列提供一個單一的程式設計環境。英特爾於 2023 年推出的 oneAPI 和 AI 工具,將能夠釋放 Intel Max 系列產品的先進功能。
「為確保每個 HPC 工作負載都能夠被完美執行,我們需要能夠最大幅度提升頻寬、運算能力、開發者生產力,並發揮最大影響力的解決方案。Intel Max 系列產品為更廣泛的市場帶來高頻寬記憶體以及 oneAPI,讓 CPU和 GPU之間共享程式碼變得容易,並更快速地解決全球最為重大的挑戰。」
英特爾企業副總裁暨超級運算事業部總經理- Jeff McVeigh
高效能運算 (HPC) 代表著科技先鋒,大量採用最為先進的創新技術,從降低氣候變化的衝擊再到治療全球最為致命的疾病,解決科學和社會的最重大挑戰。
Max 系列產品透過可擴展、相互平衡的 CPU 和 GPU 滿足此一社群的需求,其融合了突破性的記憶體頻寬,並由開放、基於標準、跨架構程式設計框架的 oneAPI 聯合在一起。研究人員和企業將利用 Max 系列產品更快、更永續地解決問題。
Max 系列產品預計將於 2023 年 1 月推出。為履行對客戶的承諾,英特爾正在出貨配備 Max 系列 GPU 的刀鋒式伺服器給阿貢國家實驗室,為 Aurora 超級電腦注入動力,並向洛色拉莫士國家實驗室 (Los Alamos National Laboratory)、京都大學 (Kyoto University) 和其它超級運算站點提供 Xeon Max CPU。
Xeon Max CPU 在 350 瓦的範圍之中,提供多達 56 個由 4 片晶片塊所構成的效能核心,並使用英特爾的嵌入式多晶片互連橋接 (EMIB) 相互連接。Xeon Max CPU 包含 64GB 高頻寬封裝內記憶體,以及 PCI Express 5.0 和 CXL 1.1 I/O。Xeon Max CPU 將為每個核心提供超過 1GB 的高頻寬記憶體 (HBM) 容量,足以應付絕大多數常見的 HPC 工作負載。與競爭對手相比,Max 系列 CPU 在實際 HPC 工作負載可提升高達 4.8 倍的效能。
- 在相同的 HPCG 效能下,比 AMD Milan-X 叢集降低 68% 功耗。
- AMX 延伸指令集提升 AI 效能,在使用 INT32 累積 (accumulation) 運算的 INT8 工作中,相較 AVX-512 提供 8 倍的峰值吞吐量。
- 提供不同 HBM 和 DDR 記憶體組態運作的彈性。
- 工作負載測試:
- 氣候建模:僅使用 HBM 執行 MPAS-A 時,比 AMD Milan-X 快 2.4 倍。
- 分子動力學:在 DeePMD 方面,相較使用 DDR 記憶體的競品,效能提升 2.8 倍。
Max 系列 GPU 提供多達 128 個 Xe-HPC 核心,這是目標針對最嚴苛運算工作負載的新基礎架構。此外,Max 系列 GPU 還具備以下特色:
- 業界最多的 408MB L2 快取以及 64MB L1 快取,提升吞吐量和效能。
- 唯一具備原生光線追蹤加速功能的 HPC∕AI GPU,專為加速科學視覺化和動畫製作而設計。
- 工作負載測試:
- 金融:Riskfuel 選擇權定價方面,相較 NVIDIA A100 的效能提升 2.4 倍。
- 物理:NekRS 虛擬反應爐模擬方面,相較 A100 提升 1.5 倍。
Max 系列 GPU 將提供多種外型尺寸,滿足不同客戶的需求。
- Max 系列 1100 GPU:一款 300 瓦的雙槽 PCIe 卡,具備 56 個 Xe 核心和 48GB HBM2e 記憶體,亦可透過 Intel Xe Link 橋接器連接多張卡。
- Max 系列 1350 GPU:一款 450 瓦的 OAM 模組,具備 112 個 Xe 核心和 96GB HBM。
- Max 系列 1550 GPU:英特爾最高效能的 600 瓦 OAM 模組,具備 128 個 Xe 核心和 128GB HBM。
除了單卡和模組之外,英特爾將提供具備 4 個 GPU OAM 載板和 Intel Xe Link 的 Intel Data Center GPU Max 系列子系統,實現子系統內高效能多 GPU 通訊。
目前正在阿貢國家實驗室建造的 Aurora 超級電腦,預計將於 2023 年成為第一台雙精度峰值運算效能超過 2 exaFLOPS 的超級電腦。Aurora 也將是首款展示 Max 系列 GPU 和 CPU 於單一系統當中相互搭配,以打造強大的超級電腦,其具備超過 10,000 台刀鋒式伺服器,每台刀鋒式伺服器包含 6 個 Max 系列 GPU 和 2 個 Xeon Max CPU。
SC22 前夕,阿貢和英特爾揭曉 Sunspot,為具備 128 台量產型刀鋒式伺服器的 Aurora 測試開發系統。來自 Aurora 先期科學計畫的研究人員,將於 2022 年底開始使用該系統。
Max 系列產品將為其它數個對國家安全和基礎研究十分重要的 HPC 系統注入動力,包含洛色拉莫士國家實驗室的 Crossroads,勞倫斯利物浦國家實驗室 (Lawrence Livermore National Laboratory) 和桑迪亞國家實驗室 (Sandia National Laboratory) 的 CTS-2 系统,以及京都大學的 Camphor3。
在 Supercomputing 2022 上,英特爾及其客戶將展示來自 12 家 OEM,即將推出超過 40 個使用 Max 系列產品的系統設計。與會者能夠從 AI 和 HPC 應用的角度,探索 Max 系列產品所展示出的效能與功能,並在英特爾攤位 2428 號聆聽來自英特爾架構師、客戶以及終端使用者對於英特爾平台解決方案的分享。更多有關英特爾 SC22 活動資訊請按此。
代號為 Rialto Bridge 的 Intel Data Center Max 系列 GPU,是下一代 Max 系列 GPU,預計將於 2024 年推出,不僅效能更提升,亦提供無縫升級。英特爾正緊接計畫推出下個主要架構更新,開啟 HPC 的未來。即將推出代號為 Falcon Shores 的 XPU,將結合 Xe 和 x86 核心至單一封裝。這項突破性的新架構還將靈活地整合來自英特爾與客戶的新 IP,並採用英特爾 IDM 2.0 模式進行製造。