UNIKO's Hardware
  • 評測
    • 處理器
    • 主機板
    • 顯示卡
    • 記憶體
    • 儲存 | SSD | HDD | 外接盒
    • 水冷散熱器 | 空冷散熱器 | 風扇
    • 機殼 | 電源 | 配件
    • 顯示器
    • 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風
    • 筆記型電腦 | 桌上型電腦 | 電競掌機
    • 手機 | 分享器 | 無線網路
    • 顯示卡驅動 | 晶片組驅動
    • 其他硬體
  • 新聞
  • 新聞稿
  • 軟體
  • 聯絡
  • ZH-TW
    • ZH-TW
    • ZH-CN
    • EN
    • JA
    • KO
No Result
View All Result
UNIKO's Hardware
No Result
View All Result
UNIKO's Hardware
Home 評測開箱 處理器

X86 AI PC 最強 NPU!AMD XDNA 2 架構解析

深入探索 AMD XDNA 2 性能

HoePC by HoePC
2024-07-24
in 處理器, 評測開箱
0
Share on FacebookShare on Twitter

X86 AI PC 最強 NPU!AMD XDNA 2 架構解析

AMD Ryzen 7040 系列配備了第一代 NPU,而 Ryzen 8040 系列則搭載了第二代 NPU,皆基於 XDNA 架構。現在 Ryzen AI 300 系列更進一步,採用了基於 XDNA 2 架構的 NPU,使算力飆升至 50 TOPS,遠超微軟 Copilot PC+ 的 40 TOPS 性能需求及眾多競爭對手。XDNA 2 架構究竟具備何種優勢,為何能提供遠超一般處理器的 AI 運算效能?這邊將為你揭曉答案!

  • 專業的 AI 運算交給 AMD XDNA 2
  • XDNA 2 架構領先技術
  • 強大的生態圈
  • 總結

專業的 AI 運算交給 AMD XDNA 2

在 AI PC 時代,AI 應用的專門需求,促使我們需要採用一種全新的架構來實現更高的能源效率。從圖中可以看出,隨著 AI 應用負載的日益特殊化,CPU 和 GPU 在運算能效比方面已經捉襟見肘,而專為 AI 運算設計的 NPU,在這方面顯示出明顯的優勢。

為什麼 NPU 成為 AI PC 的必備功能?在 AI 應用領域,模型的規模和多樣性不斷增長,已成為作業系統不可或缺的一部分。因此提高 AI 運算效率,比以往任何時候都顯得更加重要。從 AI 模型每瓦性能的比較來看,相對於 CPU,整合圖形的內顯提供了約 8 倍的能效,而 NPU 則能提供高達 35 倍的能效,NPU 明顯在 AI 運算方面的能效表現無與倫比。

AMD Ryzen AI 300 系列處理器作為新一代全能 AI 處理器,同時提供全新的 CPU、NPU 和 GPU 架構,帶來更好的 AI PC 使用體驗。到了 2024 年,第三代 AMD Ryzen AI 已經擁有超過 150 個 AI 輔助的 ISV,AI 生態圈發展非常迅速。

Ryzen AI 所使用的 XDNA 架構之所以最適合 AI 運算,主要原因在於它採用了靈活的運算結構和更具適應性的記憶體層次結構。相較於傳統的多核心處理器架構,XDNA 架構避免了資料堵塞的情況。同時透過軟體管理記憶體,避免了快取未命中的問題,因此能提供穩定而準確的性能表現。其可程式互聯設計有效降低記憶體頻寬消耗,並實現了資源隔離。

這兩大特點讓 XDNA 架構能實現計算單元的靈活分區。正如圖片所示,它可以使用 8 個 AIE 來處理即時視訊,另 8 個 AIE 來處理即時音訊,再用 16 個 AIE 來處理內容創作。其空間的可重構性和高效的多工性能,保證了 AI 運算的即時性能。搭載在 Ryzen 7040 / 8040 系列上的 NPU 便採用了 XDNA 架構,從實際表現來看,達到了預期的高能效 AI 計算效果。

XDNA 2 架構領先技術

AMD XDNA 2 架構顯著提升了 AI 運算性能,相較於 XDNA,AI 引擎單元數量從 20 個增加至 32 個,NPU 性能從 10 TOPS 增至 50 TOPS。新架構提供了每個單元雙倍的 MACs、1.6 倍的記憶體,並支援 Block Floating Point 模式及增強的非線性運算能力。這些改進不僅大幅提升了運算能力,還增強了多工處理能力和續航效能。

相較於 Ryzen 7040 系列,第三代 Ryzen AI 300 系列提供高達 5 倍的計算能力,支援最多 8 個並發空間流,顯著提升多工處理效能。同時其能源效率提升高達 2 倍,採用基於列的電源閘控技術,可延長電池續航時間。

重點來了,Block Floating Point 模式可以說是 XDNA 2 的核心亮點。目前大多數 AI 應用使用的是 16 位精度,也就是 FP16 (16 位浮點) 模式,而筆電平台則為了提高效率而選擇 8 位精度,即 INT8 (8 位整數) 模式。FP16 提供了更高的精度,而 INT8 則更具效率。AMD 在 XDNA 2 中引入了 Block FP16 模式,就是兼顧兩者的性能與精度優勢。

AMD 官方資料,Block FP16 的吞吐量幾乎與 INT8 / W8A8 持平,比 INT8 / W8A16 高出約兩倍。雖然 Block FP16 在 9 位元儲存模型的體積上僅略高於 INT8,但遠低於 FP16,有效節省了儲存空間。使用 Llama2-7B 模型時,Block FP16 的精度達到 FP16 的約 99.9%,比 INT8 / W8A16 更高,甚至是 INT8 / W8A8 的兩倍。這表明 Block FP16 結合了 INT8 的高效能與 FP16 的高精度,讓 XDNA 2 架構的第三代 Ryzen AI NPU 在 AI 算力上領先對手。即便與 FP32 基線相比,Block FP16 幾乎沒有精度損失,為 ISV 提供了一條強而有力的通道。

基於 XDNA 2 架構的第三代 Ryzen AI NPU,達到最高 50 TOPS 的 Float16 峰值效能,遠超 Apple M4 ANE、Intel Lunar Lake NPU 和高通 Snapdragon Elite X NPU。XDNA 2 在 XDNA 的基礎上擴大規模,支援 Block FP16,實現了業界領先的 AI 算力,提供非常強大的 AI 加速體驗。

強大的生態圈

在硬體方面 XDNA 2 已經展示了卓越性能。配套的生態圈方面,AMD 與微軟的多年合作,已經顯著推進了 AI 生態系統的發展,涵蓋感知、生成式 AI 及協作與溝通等領域。目前所有模型均能在基於 XDNA 2 架構的 NPU 上提供出色的 Copilot+ 體驗。

最常用的 Stable Diffusion XL Turbo 本地 AI 圖片生成工具支援 Block FP16,可在 XDNA 2 架構的 NPU 上實現超快速的圖片生成。

Llama2 大語言模型使用 Block FP16 實現高精度與高效能。基於 Llama2 7B 模型的 AI 響應速度,XDNA 2 架構的 Ryzen AI NPU 提供了比 Intel Core Ultra 7 155H 內建 NPU 的反應速度還快上了五倍。

在本地檢索增強生成 (RAG) 測試中,Llama2-7B 模型能在第三代 Ryzen AI NPU 上完美執行。使用者可以隨時更新本地 RAG 的資料,以提高回答問題的準確性。

對於開發者來說,Ryzen AI 讓開發各種模型變得簡單。它支援超過 1000 種模型,包括 CNN 和 Transformer,並相容 INT4 / 8、Block FP16、FP16 等資料類型。Ryzen AI 還最佳化了 Halo 模型,支援 Llama、Mistral、Qwen 大語言模型和 Stable Diffusion 文生圖。在執行端 Ryzen AI 支援 ONNX 運行時,實現了在 Ryzen AI 筆電上的應用整合。

AMD 統一 AI 軟體堆疊,使 Ryzen AI APU 的 CPU+NPU+GPU 三部分融為一體,加速架構能提供卓越的 AI 應用體驗。它對開源平台如 PyTorch、TensorFlow 和 ONNX 提供良好支援,並為 CPU (Zen 5)、GPU (RDNA 3.5) 和 NPU (XDNA 2) 都提供了運行時,AI 工作負載分區、編譯和最佳化功能。硬體方面,強大的 CPU、GPU 和 NPU 架構支撐了整體 AI 加速性能。

總結

AMD Ryzen AI 300 處理器內建的 XDNA 2 架構 Ryzen AI NPU,是目前性能最強的 NPU。XDNA 2 在 XDNA 基礎上擴展規模和提升性能,達到 50 TOPS 的峰值算力,成為 Copilot+PC 的最佳選擇。XDNA 2 還支援獨特的 Block FP16 模式,結合 INT8 的性能和 FP16 的精準度,同時支援高級資料類型和廣泛的模型。統一 AI 軟體堆疊進一步提升了 ISV 的 AI 應用體驗。綜合來看 XDNA 2 架構的第三代 Ryzen AI NPU 的 Ryzen AI PC,無疑能提供當前最佳的 AI 應用體驗,並支援未來深度整合 AI 功能的 Windows 作業系統。

AMD XDNA 架構

延伸閱讀

領先的 X86 AI PC 處理器 !AMD Ryzen AI 300 強勢登場

AMD TECH DAY 2024 洛杉磯,RYZEN 9000 系列處理器 7 月 31 正式發售

Tags: 評測開箱ZEN 5XDNA 2AMDRyzen
Previous Post

領先的 X86 AI PC 處理器 !AMD Ryzen AI 300 強勢登場

Next Post

AMD 揭露更多 ZEN 5 架構資訊

HoePC

HoePC

UNIKO’s Hardware 網站編輯,專長測試 3C 及開箱評測,很喜歡動物像是貓貓狗狗老鼠兔子等,平常常做的事是更新 3C 新資訊,還有看影集電影喜愛恐怖驚悚懸疑劇情等影片,有空閒時喜歡到處旅遊。

Next Post
AMD 揭露更多 ZEN 5 架構資訊

AMD 揭露更多 ZEN 5 架構資訊

映泰新推出 MS-1315UE / MS-1315URE / MS-1345UE / MS-1345URE 應用系統

高性能運算主機!映泰新推出 MS-1315UE 與 MS-1345UE 應用系統

強效精巧! ASUS Prime GeForce RTX 40 系列顯示卡震撼登場

強效精巧! ASUS Prime GeForce RTX 40 系列顯示卡震撼登場

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

ROG-玩家共和國專頁
computexCloudways 主機

關於我們

UNIKO’s Hardware Follow us for the latest PC hardware news, unboxing, reviews and everything in-between!

UNIKO’s Hardware 玩家觀點看產品,真實呈現! 華人圈最可愛的電腦硬體評測開箱、3C業界新聞、電腦改裝、遊戲電競!

熱門標籤

主機板 (213) 儲存 | SSD | HDD | 外接盒 (69) 其他硬體 (7) 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風 (100) 手機 | 分享器 | 無線網路 (45) 新聞 (3920) 新聞稿 (1586) 機殼 | 電源 | 配件 (125) 水冷散熱器 | 空冷散熱器 | 風扇 (112) 筆記型電腦 | 桌上型電腦 | 電競掌機 (47) 處理器 (117) 記憶體 (60) 評測開箱 (1510) 軟體 (516) 顯示卡 (197) 顯示卡驅動 | 晶片組驅動 (346) 顯示器 (10)

熱門架站軟體教學

  • 什麼是 WordPress?
  • WordPress 架站的五大步驟
  • WordPress 三大新手主機完整比較
  • 如何用 WordPress 自架部落格
  • 如何用 WordPress 自架形象官網
  • 如何用 WordPress 自架型錄購物網站
  • 評測
  • 新聞
  • 軟體
  • 聯絡

Copyright © © 2025 UNIKO's Hardware All rights reserved. | 網頁設計: 帶路姬數位科技有限公司.

No Result
View All Result
  • 評測 & 開箱
    • 處理器
    • 主機板
    • 顯示卡
    • 記憶體
    • 儲存 | SSD | HDD | 外接盒
    • 水冷散熱器 | 空冷散熱器 | 風扇
    • 機殼 | 電源 | 配件
    • 顯示器
    • 周邊 | 鍵盤 | 滑鼠 | 耳機 | 麥克風
    • 筆記型電腦 | 桌上型電腦 | 電競掌機
    • 手機 | 分享器 | 無線網路
    • 顯示卡驅動 | 晶片組驅動
    • 其他硬體
  • 新聞
  • 新聞稿
  • 軟體
  • 聯絡

Copyright © © 2025 UNIKO's Hardware All rights reserved. | 網頁設計: 帶路姬數位科技有限公司.