AMD 在 Advancing AI 2025 中,發表全面的端對端整合式 AI 平台願景,並推出基於業界標準所建構的開放式、可擴展機架級 AI 基礎設施。全新的 Instinct MI350 系列 GPU 搭配 ROCm 7 開源 AI 軟體堆疊 ,可帶來更加強大的 AI 運算效能,並具備性價比優勢。
AMD Instinct MI350 系列 GPU 正式亮相
AMD 董事長暨執行長蘇姿丰博士表示,AMD 正以劃時代的速度引領AI創新,此一進程顯著體現於 AMD 所發布的 Instinct MI350 系列加速器、新一代 AMD “Helios” 機架級解決方案所帶來的突破性進展,以及 ROCm 開放軟體堆疊日益壯大的發展動能。現在正邁入 AI 發展的下一階段,其核心驅動力來自於開放標準、共同創新,以及 AMD 在廣泛的硬體與軟體合作夥伴產業體系中持續擴展的領導地位,共同擘劃 AI 的未來願景。
AMD 宣布推出廣泛的硬體、軟體和解決方案產品陣容,以全面推動 AI 進程:
- AMD 發表 Instinct MI350 系列 GPU,為生成式 AI 和高效能運算樹立效能、效率和可擴展性的全新標竿。MI350 系列包含 Instinct MI350X 和 MI355X GPU 及平台,相較於上一代產品,提供 4 倍的 AI 運算能力提升及 35 倍的推論能力躍進,助力各產業實現變革性 AI 解決方案。MI355X 在性價比方面亦帶來顯著提升,相較於競爭對手解決方案,每美元可產生多達 40% 的 Token。詳情請參閱 AMD 人工智慧事業群資深副總裁 Vamsi Boppana 的部落格文章。
- AMD 展示端對端、開放標準的機架級 AI 基礎設施,搭載 AMD Instinct MI350 系列加速器、第 5 代 AMD EPYC 處理器和 AMD Pensando Pollara NIC,已部署於 Oracle Cloud Infrastructure (OCI) 等超大規模雲端供應商 (hyperscaler) 環境中,並預計於 2025 年下半年廣泛上市。
- AMD 亦預覽了新一代 AI 機架 “Helios”,將搭載新一代 AMD Instinct MI400 系列 GPU、“Zen 6” 架構的 AMD EPYC “Venice” CPU 和 AMD Pensando “Vulcano” NIC。相較於上一代產品,AMD Instinct MI400 系列 GPU 預計在混合專家模型上運行推理的效能將提升高達 10 倍。詳情請參閱此部落格文章。
- 最新版本的 AMD 開源 AI 軟體堆疊 ROCm 7,旨在滿足生成式 AI 和高效能運算工作負載日益增長的需求,同時全面顯著提升開發人員體驗。ROCm 7 具備更完善的業界標準框架支援、擴展的硬體相容性,以及全新的開發工具、驅動程式、API 和函式庫,以加速 AI 開發和部署。詳情請參閱 AMD AI 軟體開發全球副總裁 Anush Elangovan 的部落格文章。
- Instinct MI350 系列超越了 AMD 將 AI 訓練和高效能運算節點能源效率提升 30 倍的 5 年目標,最終實現了 38 倍的顯著提升。AMD 更公布了 2030 年全新目標,以 2024 年為基準年,將機架級能源效率提升 20 倍,使目前需要超過 275 個機架的典型 AI 模型到 2030 年能在少於一個全面運用的機架中進行訓練,並減少 95% 的電力消耗。詳情請參閱 AMD 資深副總裁暨院士 Sam Naffziger 的部落格文章。
- AMD 同步宣布 AMD Developer Cloud 將廣泛提供予全球開發人員和開源社群。此平台專為快速、高效能 AI 開發而設計,使用者將能存取功能齊全的雲端環境,具備所需工具和靈活性以啟動 AI 專案,並實現無限成長。透過 ROCm 7 和 AMD Developer Cloud,AMD 正持續擴大新一代運算的存取權限並使其更易於實現。與 Hugging Face、OpenAI 和 Grok 等領導者的策略合作,證明了共同開發開放式解決方案的強大力量。
廣泛的合作夥伴產業體系展示由 AMD 挹注動能的 AI 進展
全球前 10 大模型建構商與 AI 公司中,已有 7 家在其生產工作負載中採用 AMD Instinct 加速器。其中,Meta、OpenAI、微軟和 xAI 等攜手 AMD 及其他合作夥伴於 Advancing AI 大會中深入探討其如何與 AMD 合作推動 AI 解決方案訓練當今領先的 AI 模型、大規模推動推論以及加速 AI 探索與開發:
- Meta 詳述如何廣泛部署 Instinct MI300X 於 Llama 3 和 Llama 4 推論。Meta 對於 MI350 及其運算能力、每總體擁有成本 (TCO) 的效能表現,以及新一代記憶體感到非常振奮。Meta 將持續與 AMD 密切合作,推動 AI 藍圖,其中包括 Instinct MI400 系列平台的相關計畫。
- OpenAI 執行長 Sam Altman 闡述硬體、軟體與演算法全面最佳化的重要性,並強調 OpenAI 與 AMD 在 AI 基礎設施方面的緊密合作,包括採用 MI300X 開發 Azure 研究及 GPT 模型,以及在 MI400 系列平台上的深度設計合作。
- Oracle Cloud Infrastructure (OCI) 是首批採用搭載 AMD Instinct MI355X GPU 之 AMD 開放式機架級AI基礎設施的業界領導者之一。OCI 運用 AMD CPU 和 GPU 為 AI 叢集提供平衡、可擴展的效能,並宣布將推出由最新 AMD Instinct 處理器加速的 Zettascale AI 叢集,搭載高達 131,072 個 MI355X GPU,協助客戶實現大規模的 AI 建構、訓練和推論。
- HUMAIN 分享其與 AMD 簽訂的里程碑式協議,旨在運用唯獨 AMD 才能提供的全方位運算平台,建構開放、可擴展、具彈性且具成本效益的 AI 基礎設施。
- 微軟宣布 Instinct MI300X 現已為在 Azure 上專屬和開源模型提供生產力。
- Cohere 指出其高效能、可擴展的 Command 模型已部署在 Instinct MI300X 上,以高吞吐量、效率和資料隱私為企業級 LLM 推論提供動能。
- Red Hat 描述其與 AMD 擴大的合作如何實現生產就緒的 AI 環境,透過 Red Hat OpenShift AI 上的 AMD Instinct GPU,在混合雲環境中提供強大、高效率的 AI 處理。
- Astera Labs 強調開放的 UALink 產業體系如何加速創新並為客戶帶來更大的價值,並分享了提供全面的 UALink 產品組合以支援新一代 AI 基礎設施的計畫。
- 作為 UALink 聯盟的成員,Marvell 與 AMD 攜手合作共同開發開放的互連技術,為 AI 基礎設施帶來極致的靈活性。