UNIKO's Hardware
  • 評測
    • 處理器
    • 主機板
    • 顯示卡
    • 記憶體
    • 儲存 | SSD | HDD | 外接盒
    • 水冷散熱器 | 空冷散熱器 | 風扇
    • 機殼 | 電源 | 配件
    • 顯示器
    • 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風
    • 筆記型電腦 | 桌上型電腦 | 電競掌機
    • 手機 | 分享器 | 無線網路
    • 顯示卡驅動 | 晶片組驅動
    • 其他硬體
  • 新聞
  • 新聞稿
  • 軟體
  • 聯絡
  • ZH-TW
    • ZH-TW
    • ZH-CN
    • EN
    • JA
    • KO
No Result
View All Result
UNIKO's Hardware
No Result
View All Result
UNIKO's Hardware
Home 新聞

NVIDIA 首日支援 Google DeepMind 最新 DiffusionGemma 開放 AI 模型

DGX Spark 實測突破每秒 150 tokens

JC by JC
2026-06-11
in 新聞
0
Share on FacebookShare on Twitter

NVIDIA 首日支援 Google DeepMind 最新 DiffusionGemma 開放 AI 模型

Google DeepMind 正式發布開放 AI 語言模型 DiffusionGemma,NVIDIA 同步宣布旗下 RTX 與 DGX 全系列平台提供首日完整支援。搭載 GB10 處理器的 DGX Spark 可達每秒 150 tokens,單張 H100 更能突破每秒 1,000 tokens,效能表現令人矚目。

Google DeepMind 帶來全新開放語言模型

Google DeepMind 日前正式推出名為 DiffusionGemma 的開放 AI 文字生成模型,這款模型最大的特色在於採用擴散式架構 (Diffusion Architecture),與傳統自回歸模型 (Autoregressive Model) 一次只生成一個 token 的方式截然不同,DiffusionGemma 每一步驟可同時對最多 256 個 tokens 進行去噪處理,大幅提升文字生成的速度。

DiffusionGemma 建構在 Gemma 4 架構之上,採用混合專家 (Mixture-of-Experts) 設計,總參數量達 252 億,但每個步驟只需啟動 38 億個參數,並在 Gemma 4 架構基礎上加入擴散頭 (Diffusion Head)。這種設計不僅讓模型在本地硬體上依然可以流暢運行,整體效能更比同等規模的自回歸模型快上約 4 倍。此外,這款模型支援的上下文長度高達 256K tokens,精度格式方面同時支援 BF16 與 NVFP4。

在授權方面,DiffusionGemma 採用寬鬆的 Apache 2.0 授權,不需要雲端服務、也無需按 token 付費,完全可以在本地端的 RTX 或 DGX 系統上運行。目前已在 Hugging Face Transformers、vLLM 以及 Unsloth 平台提供即開即用的支援。

NVIDIA 在 DiffusionGemma 發布的同一天,便對外宣布旗下 GeForce RTX 消費顯卡、RTX PRO 工作站平台以及整個 DGX 產品線,全面提供首日 (Day-1) 支援。NVIDIA 表示,此次支援不需要任何額外調整,直接透過現有的 Tensor Core 架構以及 CUDA 軟體堆疊即可完整運作。

NVIDIA AI 在官方 X 貼文中也提到,此次支援包含 Hugging Face 上的 BF16 與 NVFP4 模型權重,以及對 vLLM、Unsloth 等主流推理框架的相容性,方便開發者直接上手。對於想要立刻體驗的使用者,目前可以直接在 RTX 5090 或 DGX Spark 系統上進行試用。

NVIDIA 同時公布了各平台的實測效能數據,展示 DiffusionGemma 在不同硬體環境下的表現。搭載 NVIDIA GB10 Grace Blackwell Superchip、擁有 128GB 統一記憶體 (Unified Memory) 的 DGX Spark 個人 AI 超級電腦,可達到每秒 150 tokens 的推理速度,且預裝 NVIDIA AI 軟體堆疊,非常適合 AI 原型開發、微調訓練以及本地 Agent 工作流程。

更高階的 DGX Station 搭載 NVIDIA GB300 Grace Blackwell Ultra Superchip,配備高達 748GB 的一致性記憶體 (Coherent Memory) 與最高 20 PFLOPS 的 FP4 運算能力,能夠支援參數量達 1 兆的超大型模型,推理速度最高可達每秒 800 tokens,是目前本地端推理效能最強的選擇之一。至於 DGX Station 配備單張 H100 Tensor Core GPU 的平台,則可實現每秒超過 1,000 tokens 的驚人效能。

面向創作者與 AI 開發者的 RTX PRO 6000 工作站也在支援名單之內,提供低延遲本地推理與 Agentic Loop 工作流程所需的充裕算力。至於消費級的 GeForce RTX 顯卡,NVIDIA 亦確認即將透過 llama.cpp 提供支援,確切時程仍待公布。

對開發者與研究人員而言,DiffusionGemma 最吸引人的地方,除了速度本身之外,更在於它能夠完全在本機運作這件事。不需要依賴雲端 API、不需要擔心 token 費用,只要有 NVIDIA RTX 或 DGX 硬體,加上已預裝的 NVIDIA AI 軟體環境,就能直接展開模型的測試、微調或部署工作,大幅降低了進入門檻。

搭配 Apache 2.0 的開放授權,DiffusionGemma 對企業內部應用、學術研究甚至個人專案都相當友善,預期將吸引大量開發者在本地工作站或個人 AI 超級電腦上進行部署與二次開發。

消息來源

延伸閱讀

AMD 宣示統一記憶體 UMA 架構將重塑產品路線圖,Ryzen AI MAX 400 支援 192GB 記憶體

Tags: NVIDIAGOOGLEAINews 新聞
Previous Post

BIOSTAR 映泰於 COMPUTEX 2026 展出全面邊緣 AI 解決方案

Next Post

Xbox 下世代主機恐破千美元?執行長坦言大眾玩家負擔不起

JC

JC

UNIKO's Hardware 網站編輯,關心3C科技天下事,平時喜歡評測和開箱,也是個愛打電動的宅宅

Next Post
Xbox 下世代主機恐破千美元?執行長坦言大眾玩家負擔不起

Xbox 下世代主機恐破千美元?執行長坦言大眾玩家負擔不起

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

ROG-玩家共和國專頁

關於我們

UNIKO’s Hardware Follow us for the latest PC hardware news, unboxing, reviews and everything in-between!

UNIKO’s Hardware 玩家觀點看產品,真實呈現! 華人圈最可愛的電腦硬體評測開箱、3C業界新聞、電腦改裝、遊戲電競!

熱門標籤

主機板 (228) 儲存 | SSD | HDD | 外接盒 (76) 其他硬體 (7) 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風 (108) 手機 | 分享器 | 無線網路 (49) 新聞 (4443) 新聞稿 (2282) 機殼 | 電源 | 配件 (156) 水冷散熱器 | 空冷散熱器 | 風扇 (129) 筆記型電腦 | 桌上型電腦 | 電競掌機 (53) 處理器 (137) 記憶體 (60) 評測開箱 (1626) 軟體 (605) 顯示卡 (210) 顯示卡驅動 | 晶片組驅動 (386) 顯示器 (12)

熱門架站軟體教學

  • 什麼是 WordPress?
  • WordPress 架站的五大步驟
  • WordPress 三大新手主機完整比較
  • 如何用 WordPress 自架部落格
  • 如何用 WordPress 自架形象官網
  • 如何用 WordPress 自架型錄購物網站
  • 評測
  • 新聞
  • 軟體
  • 聯絡

Copyright © 2026 UNIKO's Hardware All rights reserved. | 網頁設計: 帶路姬數位科技有限公司.

No Result
View All Result
  • 評測 & 開箱
    • 處理器
    • 主機板
    • 顯示卡
    • 記憶體
    • 儲存 | SSD | HDD | 外接盒
    • 水冷散熱器 | 空冷散熱器 | 風扇
    • 機殼 | 電源 | 配件
    • 顯示器
    • 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風
    • 筆記型電腦 | 桌上型電腦 | 電競掌機
    • 手機 | 分享器 | 無線網路
    • 顯示卡驅動 | 晶片組驅動
    • 其他硬體
  • 新聞
  • 新聞稿
  • 軟體
  • 聯絡

Copyright © 2026 UNIKO's Hardware All rights reserved. | 網頁設計: 帶路姬數位科技有限公司.