
AI 新創公司 Zyphra 正式攜手 AMD 推出全棧式雲端 AI 平台 Zyphra Cloud,以 15 MW 的 AMD Instinct MI355X GPU 算力為核心,支援 DeepSeek V3.2、Kimi K2.6 等頂尖開源模型的推論服務,並計畫未來擴展至 MI450 系列。平台整合模型服務、智能代理基礎架構與可擴展算力,為開發者、企業及前沿 AI 超大規模業者提供高效低延遲的生產級 AI 解決方案。
Zyphra Cloud 攜手 AMD 打造 AI 算力平台
成立於舊金山的 AI 研究公司 Zyphra,日前宣布與 AMD 深度合作,正式推出名為 Zyphra Cloud 的全棧式雲端 AI 平台。這套平台並非單純的算力租賃服務,而是將模型服務 (model serving)、智慧代理基礎架構 (agent infrastructure) 以及可擴展運算資源整合為一體,讓開發者、企業客戶乃至前沿 AI 超大規模業者,都能在同一個平台上完成 AI 系統的建構與部署。
平台底層由 AMD 全力支撐,定位為專為 AI 原生新創、企業與前沿 AI 超大規模業者設計的「新世代雲端 (neocloud)」,而非傳統雲端服務商的附加產品。Zyphra 執行長 Krithik Puthalath 直言,這是他們研究成果的自然延伸,「我們花了多年時間在 AMD 基礎架構上建構、最佳化並驗證 AI 系統,現在我們把這些能力帶到市場,成為開發者與企業的生產平台。」
這次最令業界矚目的亮點,在於 Zyphra Cloud 宣布透過 TensorWave 基礎架構,正式開放高達 15 MW 的 AMD Instinct MI355X GPU 算力,並同步擴展至支援裸機 (bare-metal) AMD 部署模式,讓客戶能夠在預訓練、大規模強化學習與後訓練,以及代理推論等 AI 工作負載中自由運行。
15 MW 是什麼概念?以一般家庭每月用電量約 350 度 (kWh) 來換算,15 MW 的持續功耗相當於同時供應數千戶家庭用電,這樣的算力規模在業界已屬大型資料中心等級。更值得注意的是,Zyphra Cloud 平台不只著眼於推論 (inference) 工作負載,更計畫未來擴展至強化學習 (RL) 與微調 (fine-tuning) 等功能,逐步演進為更完整的整合式平台。
Zyphra Cloud 在推論服務方面,首發提供的 Zyphra Inference 是一套無伺服器推論服務,支援包含 DeepSeek V3.2、Kimi K2.6 及 GLM 5.1 等前沿開源權重模型,結合自定義核心 (custom kernels)、新型長上下文推論演算法以及進階平行化方案,為代理編程 (agentic coding)、深度研究及長周期工作流自動化等生產級用途提供高吞吐、低延遲的推論效能。
簡單來說,Zyphra Cloud 就是要讓開發者不必自建算力,也能以媲美頂尖推論性能的方式,直接呼叫這些強大的開源模型來服務真實的生產環境。
Zyphra Cloud 背後的底氣,來自 Zyphra Research 長期在 AMD 基礎架構上累積的研究實力。過去一週,Zyphra Research 發布了 ZAYA1-8B 與 ZAYA1-74B-Preview 兩款模型,兩者皆是在搭載 AMD Pensando Pollara 網路的 AMD Instinct MI300X 基礎架構上,從頭端對端完成預訓練的。同時,Zyphra Research 也推出名為 TSP 的下一代推論演算法,專為可擴展的長上下文與代理推論而設計。
這代表 Zyphra 不只是在 AMD 硬體上跑別人的模型,而是真正掌握了從算法設計、模型訓練到推論部署的完整技術鏈,並將這套能力直接轉化為雲端服務。
Zyphra Cloud 的基礎架構由 TensorWave 提供,這是一家獲得 AMD Ventures 與 Magnetar 投資支持的算力基礎建設公司,也是業界最早部署 AMD Instinct MI355X GPU 的雲端供應商之一。TensorWave 共同創辦人暨首席成長長 Jeff Tatarchuk 表示,「TensorWave 存在的目的,就是讓像 Zyphra 這樣的 AI 原生公司,能夠不妥協地取得高性能 AMD 算力。讓 Zyphra Inference 在我們的 MI355X 基礎架構上運行,正是我們創立 TensorWave 的初衷。」
Zyphra Cloud 目前提供兩種主要部署模式:一是針對彈性工作負載的按需裸機 GPU 叢集 (on-demand bare-metal GPU clusters),二是針對大規模訓練與推論部署的客製化超大規模 AMD 基礎架構 (custom hyperscale AMD infrastructure)。這樣的彈性設計,讓新創公司與大型企業都能依據自身需求,找到合適的切入點。
AMD Instinct MI355X GPU 算力已可透過 Zyphra Cloud 即刻取用。而 Zyphra 也已明確規劃,未來將逐步擴展支援下一代 AMD 平台,包含 MI450 系列及更新架構,作為其跨世代 AMD 軟體驅動基礎架構規模化藍圖的一部分。值得關注的是,業界傳聞中的 MI500 系列也可能在未來的路線圖上現身。
對於正在尋找 NVIDIA 以外算力替代方案的企業與開發者而言,Zyphra Cloud 的出現無疑是一個值得認真考量的選項。
延伸閱讀


















