NVIDIA 揭曉第三代的全球最先進人工智慧系統 NVIDIA DGX A100,除了可提供 5 Petaflops 的 AI 效能,並首度把整個資料中心的運算力與功能整合至具靈活性的單一平台。DGX A100 系統已全球出貨,第一筆訂單來自美國能源部的阿貢國家實驗室,該實驗室將運用該叢集的 AI 與運算力,進一步瞭解並對抗新冠病毒肺炎。
DGX A100 系統整合八個全新的 NVIDIA A100 Tensor Core GPU,提供 320GB 的記憶體以訓練最大型的 AI 資料集,與最新的高速 NVIDIA Mellanox HDR 200Gbps 互連。透過運用 A100 的多執行個體 (multi-instance) GPU 功能,可將每套 DGX A100 系統分割成多達 56 個執行個體,以加速處理多個小型的作業負載。結合這些功能,企業可根據需求優化其運算力與資源,並在單一且完全整合、軟體定義的平台上加速多樣化的作業負載,包括資料分析、訓練與推論。
DGX A100 即刻採用與支援
NVIDIA 創辦人暨執行長黃仁勳表示:「NVIDIA DGX A100 是專為先進人工智慧設計的終極工具。NVIDIA DGX 是第一個為了端到端的機器學習作業流程而打造的 AI 系統,從資料分析、訓練到推論皆可運用。借助最新 DGX 強大的效能躍進,機器學習工程師能在以指數型成長的 AI 模型和資料規模中保持領先。」
阿貢國家實驗室運算、環境與生命科學副主任 Rick Stevens 表示:「我們使用美國威力最強大的超級電腦來對抗新冠肺炎病毒,並在諸如 NVIDIA DGX A100 等最新的技術上運算 AI 模型並進行模擬。DGX A100 系統的運算威力將協助阿貢國家實驗室的研究人員探索治療方法與疫苗,並研究病毒的傳播,讓科學家得以在幾個月、甚至幾天內就完成數年的 AI 加速作業負載。」
佛羅里達大學將是首間收到 DGX A100 系統的美國高等學府,而該校也將運用它將 AI 納入所有的課程中,以培養其人員使他們具備 AI 能力。
佛羅里達大學校長 Kent Fuchs 表示:「佛羅里達大學擁有成為全國人工智慧領導機構的願景,而 NVIDIA 正是我們在追求這個目標上非常有價值的夥伴。我們全新的 NVIDIA DGX A100 系統將橫跨各個學科,促使我們的研究人員解決全球最迫切的挑戰,並賦予整個世代的學子為未來的勞動力帶來革命性進展的技能。」
- 生物醫學人工智慧中心 (The Center for Biomedical AI) :位於德國漢堡埃普多夫大學附設醫院,將利用 DGX A100 推進支援臨床的決定與流程的優化。
- 朱拉隆功大學 (Chulalongkorn University):泰國進行密集研究首屈一指的大學,將使用 DGX A100 來加速開創性研究,如泰語自然語言處理、自動語音辨識、電腦視覺與醫療影像等。
- Element AI:位於蒙特婁的 AI 驅動解決方案與服務的開發商,正部署利用 DGX A100 為其Orkestrator GPU 排程器加速效能與功能優化,以因應持續成長的 AI 訓練與應用需求。
- 德國人工智慧研究中心 (DFKI) :將使用 DGX A100 系統進一步加速其對於深度學習的新方法及相關解釋性的研究,同時顯著降低空間與能源的消耗。
- Harrison.ai:總部位於雪梨的健康照護 AI 公司, 將部署澳洲第一套 DGX A100 系統,以加速其AI 做為醫療裝置 (AI-as-medical-device) 的開發。
- 阿拉伯聯合大公國人工智慧部:第一家在中東部署全新 DGX A100 的單位, 打造國家級架構以加速 AI 在公部門與民間企業的研究、發展與採用。
- VinAI Research :越南領先業界的 AI 研究實驗室,位於河內與胡志明市, 將使用 DGX A100 進行高影響力的研究並加速 AI 應用。
NVIDIA 打造 700 Petaflops 的次世代 DGX SuperPOD
NVIDIA 同時也揭露其次世代的 DGX SuperPOD,這是一套由 140 個 DGX A100 系統構成的叢集,可達到 700 petaflops 的 AI 運算威力。NVIDIA 藉由結合 140 個 DGX A100 系統與 NVIDIA Mellanox HDR 200Gbps InfiniBand 互連,打造出次世代的 DGX SuperPOD AI 超級電腦,提供像是對話式 AI、基因組學與自動駕駛車領域的內部研究使用。
此叢集是全球速度最快的 AI 超級電腦之一,並達成之前需要數千台伺服器才能達到的效能水準。DGX A100 企業級的架構與效能讓 NVIDIA 得以在一個月內就打造出這套系統;反觀之前若要達到此等超級電腦的等級,則必須花費數個月、甚至數年時間進行規劃並採購特定元件。
為了協助客戶打造屬於他們自己由 A100 驅動的資料中心,NVIDIA 已發表全新的 DGX SuperPOD 參考架構。這個架構提供客戶一幅藍圖,以便遵循 NVIDIA 打造這個基於 DGX A100 AI 超級電腦叢集所使用的同一種設計原理與最佳作法。
DGX A100 技術規格
- 八個 NVIDIA A100 Tensor Core GPU,可達 5 petaflops的 AI 效能,總 GPU 記憶體達 320GB,頻寬高達每秒 12.4TB。
- 六個 NVIDIA NVSwitch™ 互連網路,並運用第三代 NVIDIA NVLink 技術達到每秒 4.8TB 雙向頻寬。
- 九個每秒 200Gb 的 NVIDIA Mellanox ConnectX-6 HDR 網路介面,提供總計每秒高達3.6Tb 雙向頻寬。
- 透過 NVIDIA Mellanox 的網路內運算 (In-Network Computing) 與網路加速引擎,如 RDMA、GPUDirect、可擴充式階層聚合 (Scalable Hierarchical Aggregation) 及 Reduction Protocol (SHARP),帶來最高的效能與擴充性。
- 15TB Gen4 NVMe 內部儲存器,比 Gen3 NVMe SSD 快 2 倍。
- 由 NVIDIA DGX 軟體堆疊所驅動,其中包括供 AI 與資料科學工作負載使用的優化軟體,達成極大化的效能,並讓企業在 AI 架構的投資能更快獲得回報。
由五套 DGX A100 系統組成的單一機架就可以取代供 AI 訓練與推論架構使用的資料中心,耗電量只需要二十分之一,且只佔原本二十五分之一的空間,而成本更只有原來的十分之一。
詳細技術規格與訂購詳情的更多訊息,請造訪 www.nvidia.com/DGXA100。
資料來源:NVIDIA新聞稿