隨著進入 Exascale 時代並加速邁向 Zettascale,科技產業對於全球碳排放量的貢獻也隨之成長。預計到 2030 年,資料中心將會消耗全球總發電量的 3%至 7%,而運算基礎設施所需電力將占據新能源使用量的首位。
今年 INTEL 承諾在 2040 年以前,達成全球營運範圍內的溫室氣體淨零排放,並持續開發更具永續性的解決方案。追隨永無止境運算需求的同時,還要創造一個可永續的未來,這是高效能運算 (HPC) 最大的挑戰之一。如果能逐一解決 HPC 運算堆疊中的各個部分—晶片、軟體和系統,仍可達成此一願景。
INTEL 於德國漢堡 ISC 2022 主題演說
從晶片和異質運算架構邁開步伐
INTEL 有項積極的 HPC 產品規劃,到了 2024 年將可提供多樣化的異質架構產品組合。這些架構讓英特爾能夠提升數個量級的效能表現,同時降低一般負載以及AI、加密和分析等新興工作負載的能耗需求。
搭載高頻寬記憶體 (HBM) 的 Intel Xeon 處理器,代號 Sapphire Rapids HBM 的產品即是一個很好的例子,闡述英特爾如何利用先進封裝技術和晶片創新,為 HPC 帶來實質性的效能、頻寬和省電等多方面改善。憑藉封裝當中最高達 64GB 的高頻寬 HBM2E 記憶體,以及整合進入 CPU 的加速器,英特爾能夠解放受限於記憶體頻寬的工作負載表現,同時在關鍵 HPC 使用案例中提供顯著的效能改善。第 3 代 Intel Xeon 可擴充處理器與即將推出的 Sapphire Rapids HBM 處理器相互比較時,於天氣研究、能源、製造和物理工作負載的效能提升 2 倍至 3 倍。在本次主題演說當中,Ansys 技術長 Prith Banerjee 也展示在實際的 Ansys Fluent 和 ParSeNet3 工作負載之中,Sapphire Rapids HBM 可提供高達 2 倍的效能提升。
英特爾於提升 HPC 和 AI 超級運算工作負載數個量級效能的過程當中,運算密度是另外一個必要條件。首款旗艦型英特爾資料中心圖形處理器 (GPU) ,代號 Ponte Vecchio,已在複雜的金融服務應用和 AI 訓練與推論工作負載,提供超越競爭對手的表現。英特爾還展現高度逼真的 OpenMC4 模擬,採用 Ponte Vecchio加速可達2倍4。
英特爾並不會就此打住,今日更宣布新款強大的資料中心 GPU,代號 Rialto Bridge。藉由推展 Ponte Vecchio 架構以及結合強化後的晶片塊 (tile) 和次世代製程節點技術,Rialto Bridge 將可提供顯著增加的密度、效能和效率,同時保有軟體一致性。
展望未來,Falcon Shores是英特爾產品規劃的下一個重大架構創新,將 x86 CPU 和Xe GPU 架構整合至單一插槽之中。這個架構預計在 2024 年帶來超過 5 倍的每瓦效能、5 倍的運算密度、5 倍的記憶體容量與頻寬等進步。
成功軟體策略的原則:開放、選擇、信任
如果沒有軟體將其融入生活,晶片就只是砂粒般的存在。英特爾的軟體策略是促進整個堆疊的開放發展並提供工具、平台和軟體 IP,協助開發者提升生產力,創造更多可擴展、效能更好、更具效率的程式碼,能夠汲取最新晶片創新的優勢,又沒有重新建構程式碼的負擔。oneAPI 產業倡議提供 HPC 開發者跨架構的程式設計環境,因此程式碼能夠透明且可移植地,在 CPU、GPU,以及其它專門的加速器上運作。
目前領先全球的研究和學術機構,有著超過 20 間的 oneAPI 卓越中心,均取得重大進展中。以 Simon McIntosh-Smith 及其英國布里斯托大學科學學系團隊作為例子,他們正在利用 oneAPI 和 Khronos Group 的 SYCL 抽象層進行跨架構程式設計,開發可在 Exascale 層級達成效能移植的最佳作法。他們的工作將確保科學程式碼,能夠在全球大規模的異質超級運算系統達到高效能。
相互結合:永續的異質運算系統
隨著越來越多資料中心和 HPC 工作負載朝向解構和異質運算的方向移動,我們將需要能夠協助更有效率地管理這些複雜且多樣化的運算環境。
英特爾今日推出 Intel XPU Manager,一款在本機或遠端監測與管理英特爾資料中心 GPU 的開源解決方案。這款方案專為簡化管理而設計,並透過執行全面性診斷,最大程度地提升可靠性和正常運作時間,改善使用率和執行韌體更新。
Distributed Asynchronous Object Storage (DAOS) 檔案系統為移動和儲存資料等耗電任務,提供系統層級的最佳化。DAOS 對於檔案系統的效能有著重大影響,同時改善整體存取時間和降低儲存所需容量,並減少資料中心所佔面積和提升能源效率。在與 Lustre 相關的 I/O 500 結果之中,DAOS 可達成直寫式檔案系統的 70 倍效能。
應對 HPC 永續性挑戰
英特爾很自豪能夠與全球各地志同道合的客戶和領先研究機構合作,實踐更為永續和開放的 HPC。近期的例子包含英特爾與西班牙巴塞隆納超級運算中心共同合作,設立一座開創性的 RISC-V Zettascale 實驗室,英特爾也持續與英國劍橋大學和 Dell 合作,將目前的 Exascale 實驗室推展成新的劍橋 Zettascale 實驗室。這些努力都建立在英特爾為未來運算所擬定的計劃,建立一個強健的歐洲創新生態系。
沒有任何一家公司能夠獨立做到這點。整個生態系包含製造、晶片、互連、軟體和系統,都需要同步投身其中。藉由這些共同努力,我們可以將本世紀最大的 HPC 挑戰之一,轉變成本世紀的最大的機會之一,並替未來世代改變這個世界。