AMD Radeon RX 7900 系列正式解禁,共有兩個型號,分別是 RX 7900 XTX 和 RX 7900 XT。這是 AMD 首款導入 Chiplet 技術的 GPU,配置 1 顆 GCD 與 6 顆 MCD 晶片集成設計,和上個世代相比同樣功耗下提升 54% 效能,升級第 2 代 Infinity Cache 和第 2 代光線追蹤引擎,更是增加了 ML 和 AI 加速運算單元,RX 7900 XT 與 RX 7900 XTX 對比 RTX 4080 差異有多少呢?
RDNA 3 架構探討
- 先進的 Chiplet 設計,5nm 顯示晶片和 6nm 記憶體快取晶片。
- GPU 核心可達 3Ghz, 61 TFLOPs FP32,1.54 倍的每瓦功耗效能。
- 全新的 ALU 指令和吞吐量,2 倍快速 ALU,支援 BF16,指令更有效率。
- 優化兼具平衡的快取系統,96 MB 第 2 代 Infinity 快取,6MB L2 快取、3MB L1、3MB L0 快取。
- 第 2 代光線追蹤,提升光追效率,更大的快取,提升 1.8 倍的光追性能。
- 柔性命令指令和幾何運算,MDIA 加速器,12 Primitive/clk 增加 50%,2 倍的硬體 Prim / Vert 剔除率。
- Pixel Pipe 更先進,光栅化 CLK 增加 50%、192 Pixels CLK 增加 50%,像素等待同步。
- 高速的 GDDR6 記憶體,20Gbps ~ 690 GB/s,最大 24GB 記憶體。
- AMD Radiance Display Engine,包含新的 DisplayPort 2.1、HDMI 2.1a 介面,12 位元通道,最多 680 一種顏色。
- Dual Media Engine,AVC / HEVC 編碼和解碼,8K60 AV1 編碼解碼,導入 AI 增強解碼。
- 其他特點方面,完整的 DX 12 終極版支援,Fidelity FX 超級解析度,AMD Advantage 智慧技術。
RDNA 3 NAVI 31 採用全新的 Chiplet 小晶片技術,改成 1 顆 5nm GCD 顯示晶片和 6 MCD 顆記憶體快取晶片,AMD 把 Infinity 快取和記憶體控制器切分成 MCD 記憶體快取晶片,Infinity Link 及 Die-to-Die Fanout Rounting 讓 GCD 和 MCD 可以更低的延遲,當然這也是 GPU 可以 OC 到 3GHz 的技術。
Compute Unit 計算單元
Navi 31 擁有 6 組 Shader Engine,皆擁有 2 組 Graphics Array 運算群,Graphics Array 運算群內有 4 組 Dual Compute Unit (DCU),所以 Shader Engine 裡面只有 8 組 Dual Compute Unit,並共享 L1 快取、Rasterizer、RB+、Prim Unit 相關資源,所以一共有 96 組 Compute Unit 計算單元。快取方面也增加不少,96 MB 第 2 代 Infinity 快取,6MB L2 快取、3MB L1、3MB L0 快取。
同時也加入了 AI 加速運算單元, Vector Unit 能進行 Matrix 矩陣運算,指令支援新增 BFloat16,另外還有 WMMA 矩陣乘法。
Ray Tracing 第 2 代光線追蹤
第 2 代 Ray Accelerator (RA) 加速單元,增強了 BVH 遍歷與射線三角運算能力,增加 Geometry Flags 和 Ray Flags 機制。
光追相關指令支援 Closest First、Largest First 和 Closest Midpoint,整體來說比以往 RDNA 2 光追效果提升 80% 以上,但是還是比 RTX 40 系列有差距。
快取系統和命令處理器
快取 CACHE 一直是 AMD 最為重視的架構技術之一,AMD 用以增強架構內部的輸傳速率。AMD 增大 RDNA 3 內的 L1 和 L2 快取,使每個處理單元能夠享用更寬闊的快取。L3 快取被 AMD 稱為 INFINITY CACHE,是 RNDA 架構內重要的一環。在 RDNA 3 中 L3 快取亦被大幅加闊以提高整體的吞吐量。RDNA 3 顯示卡的記憶體亦透過 384-BIT配合 64-BIT GDDR6 20Gbps。這些改進使 AMD 足以放棄功耗和發熱量更大的 GDDR6X 技術,同時保持高競爭力。
高頻率、大快取、更快的記憶體、架構改進等等,令 AMD 能夠對外宣傳 RDNA 3 在光線追蹤上達到 1.8X 的性能增幅。
RDNA 3 另一個重要的架構改進是加入指令處理器 COMMAND PROCESSOR、幾何運算GEOMETRY 和像數管道PXIEL PIPELINES,以實現全新的 DUAL MEDIA ENGINE 雙重的多媒體引擎,支援 AV1 編碼和解碼,AI 增強的影片解碼,和全新的 RADIANCE 顯示引擎。這些改進使 RDNA 3 在運算的時候能夠減輕受到 CPU 拖累而帶來的影響,並大幅提升 RDNA 3 的運算能力。在編碼與解碼的範疇上,RDNA 3 加入 AV1,追上了 INTEL 的新架構。影像輸出的部份,RDNA 3 首次支援 DISPLAY PORT 2.1,以強大的運算能力匹配巨大的 DP 2.1 頻寬。
關於散熱器和 PCB 用料
絕佳的散熱設計,鋁合金壓制外殼,強化鋁合金背板,使用更高導熱散熱膏,MOSFET 和記憶體可以有更好的散熱。
RX 7900 XTX 有 RGB 燈光,溫度夠低也有零轉速風扇,更大的軸向式風扇,首次導入進氣風扇感應器。
供電採用 20 組 Power-Stage 設計,白金等級 IT-170 材料,Low PCIe 插槽峰值電流,14 層高品質 PCB,並有 4 層 2 oz. 銅,更好的電流效率。
RX 7900 XTX | RX 7900 XT | |
---|---|---|
架構 | RDNA 3 | RDNA 3 |
製程 | 5nm + 6nm | 5nm + 6nm |
電晶體數量 | 57.7 B | 57.7 B |
核心大小 | 300 mm^2 + 220 mm^2 | 300 mm^2 + 220 mm^2 |
運算元件 | 96 | 84 |
光線加速器 | 96 | 84 |
流處理器 | 6144 | 5376 |
遊戲頻率 | 2300 MHz | 2000 MHz |
加速頻率 | 2500 MHz | 2400 MHz |
峰值單精度計算效能 | 61 TFLOPs | 52 TFLOPs |
峰值半精度計算效能 | 123 TFLOPs | 103 TFLOPs |
尖峰像素填充速率 | 480 GP/s | 460 GP/s |
尖峰紋理填充速率 | 960 GT/s | 810 GT/s |
ROPs | 192 | 192 |
AMD Infinity Cache | 96 MB | 80 MB |
記憶體 | 24 GB GDDR6 | 20 GB GDDR6 |
記憶體速度 | 20 Gbps | 20 Gbps |
記憶體介面 | 384-bit | 320-bit |
PCIe 介面 | PCIe 4.0×16 | PCIe 4.0×16 |
TBP | 355 W | 315 W |
電源供應器建議 | 800 W | 750 W |
Dual Media Engine
新的 Dual Media Engine 新增 AV1 8K60 硬體編碼,可以以相同位元率帶來更高品質的內容,或以相同品質減少檔案大小,新的媒體引擎允許兩個 AVC 和 HEVC 串流同時編碼或解碼。
VP9 | H.264 | H.265 | AV1 | |
---|---|---|---|---|
解碼 | 4K210 / 8K48 (4:2:0 8/10b) | 4K330 (4:2:0 8b) | 4K210 8K48 (4:2:0 8/10b) | 4K240 8K60 (4:2:0 8/10/12b) |
編碼 | – | 4K180 (4:2:0 8b) | 4K180 8K48 (4:2:0 8/10b) | 4K240 8K60 (4:2:0 8/10b) |
AMD Radiance Display Engine
AMD RDNA 3 新的 Radiance Display Engine 包含新的 DisplayPort 2.1 介面,頻寬高達 54 Gbps,可以支援更高刷新率的螢幕。
AMD Radiance Display Engine 支援高達 4 個顯示器。
Radeon RX 6950 XT | Radeon RX 7900 系列 | |
---|---|---|
DisplayPort 版本 | DP 1.4 | DP 2.1 |
最大刷新率 2K | 480 Hz | 900 Hz |
最大刷新率 4K | 240 Hz | 480 Hz |
最大刷新率 8K | 60 Hz | 165 Hz |
解析度 | 最大螢幕數量支援 |
---|---|
FHD480 | 4 |
FHD600 | 2 |
QHD480 | 2 |
WQHD | 2 |
4K144 | 4 |
4K240 | 2 |
4K480 | 1 |
UW5K240 | 2 |
5K60 | 4 |
5K144 | 2 |
6K60 | 4 |
6K144 | 2 |
UW8K2K120/144 | 2 |
UW8K2K240 | 1 |
8K60 | 2 |
8K120/144/165 | 1 |
RX 7900 XTX、RX 7900 XT 包裝
兩張顯示卡包裝盒都採用硬紙板,感覺很扎實。體積和樣式十分相像,看起來只有產品各自的外型圖、名稱、和一些產品細節資料不同。
RX 7900 XTX 採上掀式包裝,一打開"Welcom to the red team",歡迎來到紅隊這句標語就映入眼簾,相信 RADEON 粉絲會很有歸屬感,包裝內沒有任何線材,只有說明書。
RX 7900 XTX 盒子設計相當有趣,上掀開啟後顯示卡會被底座撐起來,有放置高級產品的味道。RX 7900 XT 就沒有撐起的設計,少了一點驚喜,但兩者包裝已經非常相似。
還有個值得一提的小巧思,就是在放置顯卡的凹槽,接近右上方的位置有 3 條細細的紅線,反向看發現居然與顯示卡上紅色散熱鰭片呼應再延伸,RED 三個紅色字體、鰭片與包裝的三條紅線都暗藏著這是 RDNA3 的訊息。
RX 7900 XTX 外觀,有質感又漂亮
RX 7900 XTX 整體配色採用黑為主,搭配上部分銀色,整體外殼都是壓鑄鋁合金,金屬質感滿滿,另外在頂部的散熱鰭片,靠近雙 8-Pin 連接器,可以看到 3 條紅線,呼應了 RDNA 3。整張卡算起來就是 375W 供電設計,但是實際上只需要 355W,而且並沒有採用新世代 12VHPWR 連接埠設計,現在看來這也算是件好事。
顯示卡正面中央風扇四周白色透明導光是 RX 7900 XTX 唯一獨有的 RGB 燈效,相當低調。
跟上一世代的 Radeon RX 6000 系列方正設計相比,這一代完全有不同感受。
更多切削角度讓顯示卡看起來更圓潤,同時也有看起來體積較小的感覺,顯示卡尾端有 4 組支撐架螺絲孔可用於固定顯示卡。
顯示卡背護甲採用一體設計,除了可以看到 RADEON 文字,還可以看到 5 個紅色三角形點裝飾,連接起來可以寫出一個"R"。
2.5 Slots 設計,上面可以看到顯示卡相關型號和序號,以往較少看到這樣配置,影像輸出方面有 4 組連接埠,2 組 DisplayPort 2.1、1 組 TYPE-C (DisplayPort 2.1)、1 組 HDMI 2.1a。
RX 7900 XTX 最後方風扇裡面藏有一顆針對進氣風扇的感應器,沒仔細看真的會遺漏。
RX 7900 XT 外觀
與 RX 7900 XTX 很相似的設計,整體都是壓鑄鋁合金外殼,但無光害,沒有任何 RGB 燈效設計;同樣是雙 8-Pin 連接器,所以整張卡最多可以擁有 375W 電力,但是實際上只需要 315W。
同樣 2.5 Slots 設計,在上面可以看到顯示卡相關型號和序號,有 2 組 DisplayPort 2.1、1 組 TYPE-C (DisplayPort 2.1)、1 組 HDMI 2.1a。
體積與外觀
RX 7900 XTX 體積為 287mm x 125mm,2.5 Slots,重量 1807g、RX 7900 XT 體積 267mm x 112mm,2.5 Slots,重量 1519g。由於高度不平整,故改以所占用的 Slots 作為計算單位。
展示 5 張顯示卡的體積差異,由上而下分別是:
- AORUS RTX 4090 MASTER
- AMD RADEON RX 5700 XT
- AMD RADEON RX 6900 XT
- AMD RADEON RX 7900 XT
- AMD RADEON RX 7900 XTX
實測效能數據
測試平台室溫控制在 26 度,無輔助風扇直吹測試平台,測試中關閉 Windows 內建防毒、關閉休眠設定,無更動電源計畫,並開啟 Resizable BAR。X670E 平台開啟 DDR5-6000 UCLK:MCLK (1:1)。
- Windows 11 Professional 22H2
- AMD-Software-Adrenalin-Edition-22.40.00.57
- NVIDIA 521.90 Gamereadywin11_win10dch_64bit_international
- AMD Chipset 4.11.15.342
種類 | 型號 |
---|---|
處理器: | AMD Ryzen 9 7950X |
主機板: | MSI MEG X670E ACE / 7D69v142 |
記憶體: | G.SKILL Trident Z5 Neo 16GB x 2 DDR5 6000 CL30 (EXPO) |
顯示卡: | AMD RADEON RX 7900 XTX AMD RADEON RX 7900 XT NVIDIA GEFORCE RTX 4080 |
儲存: | KLEVV CRAS C920 Gen4x4 2TB |
機殼: | STREACOM BC1 |
電源: | FSP Hydro PTM PRO ATX3.0 1200W |
散熱器: | MONTECH METAL DT24 Premium |
顯示器: | VG289Q |
RX 7900 XTX 功耗和溫度測試
功耗測試使用 FURMARK 和 3DMARK Time Spy EXTREME 進行燒機測試。
FURMARK 燒機 TBP 功耗約 347W,GPU 溫度是 68 度、Hot Spot 74.7 度、風扇轉速 1810 RPM,GPU 頻率可達 2045 MHz、記憶體 2487 MHz。
Time Spy EXTREME 燒機 TBP 功耗約 338W,GPU 溫度是 68 度、Hot Spot 72.8 度、風扇轉速 1708 RPM,GPU 頻率可達 2332 MHz、記憶體 2487 MHz。
RX 7900 XT 功耗和溫度測試
FURMARK 燒機 TBP 功耗約 310W,GPU 溫度是 67 度、Hot Spot 75.5 度、風扇轉速 1735 RPM,GPU 頻率可達 1948 MHz、記憶體 2487 MHz。
Time Spy EXTREME 燒機 TBP 功耗約 308W,GPU 溫度是 66 度、Hot Spot 73.7 度、風扇轉速 1753 RPM,GPU 頻率可達 2393 MHz、記憶體 2487 MHz。
然後在整機功耗下,因為我們是使用 R9 7950X 測試,RX 7900 XTX 最高功耗約在 560W ~ 580W,RX 7900 XT 500W ~ 515W,所以建議使用 850W 電源供應器即可。
3DMARK 相關測試
3DMARK 測試,Time Spy、Time Spy Extreme、Fire strike、Fire strike Extreme、Fire strike Ultra,分數越高越好。
Port Royal 是世界上第一個針對遊戲玩家的即時光線追踪基本測試,可以使用 Port Royal 來測試和比較支援微軟 DirectX 光線追踪顯示卡的光追性能,分數越高越好。
3DMark Speed Way 是 DirectX 12 Ultimate 基準測試,適用於執行 Windows 10 和 11 的遊戲電腦。Speed Way 的引擎組合可展現 DirectX 12 Ultimate 為光線追蹤遊戲帶來的全新性能最佳化。Speed Way 使用如 Mesh Shaders 等的全新 DirectX 12 Ultimate 性能最佳化,並搭載用於即時全域照明和即時光線追蹤反射的 DirectX Raytracing Tier 1.1。
DirectX 12 的測試項目 Time Spy 支援 1440P 解析度、Time Spy Extreme 支援 2160P 解析度,DirectX 11 的測試項目 Fire strike、Fire strike Extreme、Fire strike Ultra,分別對應解析度是 1080P、1440P、2160P。
3DMark PCI Express 功能測試,可測量 GPU 的可用頻寬速度。
UL Procyon benchmark
UL Procyon benchmark 是一套新上市的 Adobe Benchmark 標準化測試軟體,可以分成照片和影片兩方面的測試。照片影像運算方面的軟體是使用 Adobe Lightroom Classic 和 Adobe Photoshop,影片運算應用是搭配 Adobe Premiere Pro。
遊戲 AVG FPS & Low 1% 測試數據
遊戲測試使用 4K 2160P 解析度,遊戲特效皆設定最高 MAX,關閉 V-Sync 選項,主要運行 DX 12 優先。遊戲都是經過 5 ~ 10 次測試後擷取 FPS 數據,會去檢查是否有不正常數據存在,我們主要收集的數據是平均 AVG FPS 和 1% LOW FPS (min),1% Low FPS 可以看出遊戲真實效能。
以下 2 個遊戲有開啟光線追蹤效果。
- DiRT 5
- Shadow of the Tomb Raider
Cyberpunk 2077 FSR 2 – AVG FPS & Low 1% 測試數據
遊戲測試使用 4K 2160P 解析度,遊戲特效皆設定最高 MAX,關閉 V-Sync 選項,主要運行 DX 12 優先。遊戲都是經過 5 ~ 10 次測試後擷取 FPS 數據,會去檢查是否有不正常數據存在,我們主要收集的數據是平均 AVG FPS 和 1% LOW FPS (min),1% Low FPS 可以看出遊戲真實效能。
FSR 2.1 測試使用 Cyberpunk 2077 Benchmark,更新遊戲 1.61 Patch 就可以開啟,測試在 RX 7900 XTX、RX 7900 XT 下,關閉 FSR 2.1、開關光線追蹤,分別 FSR 2.1 設置 Ultra Performance、Performance、Blnce 和 Quality。 可以看到開啟 FSR 2.1 後,在 Ultra Performance 設定下,可以提升 300% AVG FPS。
結論
RX 7900 XTX 和 RTX 4080 遊戲對比,兩者在無光線追蹤設定下表現接近,開啟光線追蹤後,成績就不是很理想,但是透過 FSR 2 技術後,可以看到 Cyberpunk 2077 在 4K 解析度下,搭配 FSR2 Ultra Performance 設定,RX 7900 XTX 平均 FPS 達到 81,RX 7900 XT 達到 76,這也意味著未來會有更大的進步,2023 即將登場的 FSR 3 一定可以帶來更好的效能。
延伸閱讀
AMD 正式發表 RDNA 3 架構顯示卡 Radeon RX 7900 XTX & Radeon RX 7900 XT