在數位時代,遊戲與創作需求日益提升,對顯示技術的要求達到新高。無論是沉浸式 4K 遊戲,還是高速渲染的 3D 建模與影像處理,顯示卡效能已成關鍵。AMD 再次突破極限,推出 RDNA 4 架構,並將其強大實力融入 RX 9070 系列,帶來更高效的光追技術、智慧 AI 加速與穩定運算效能。面對 4K 光追遊戲、8K 影視創作與 AI 應用的挑戰,RX 9070 系列透過製程突破、架構革新與智慧加速,為玩家與創作者提供無與倫比的極致體驗。
AMD RDNA 4 詳細解析 1
這是一款專為遊戲設計的高效能圖形架構,RDNA 4 Vision 具備多項新特性,包括針對高幀率與高解析度工作負載的深度最佳化、光線追蹤與計算效率提升,以及在光線追蹤效能方面的重大突破。此外該架構全面支援高效能機器學習 (ML),增強所有工作負載的頻寬,並針對遊戲與創作者進行超採樣技術改進。與 RDNA 3 相比,RDNA 4 在不同計算單元上展現出更強勁的性能。
AMD Radeon RX 9070 XT 採用 RDNA 4 架構,帶來全面升級的效能與技術,專為極致 4K 遊戲體驗而設計。
- 第三代光線追蹤,光線交叉速率提升 2 倍,改進 BVH 壓縮技術,最佳化光線遍歷與著色效率,並引入定向邊界框 (Oriented Bounding Boxes) 以提升光追效果。
- 最佳化且平衡的快取系統,配備 64MB 第三代 Infinity Cache、8MB L2 快取與 2MB 聚合 CU 快取,大幅提升資料存取效率。
- 升級指令處理器,加強封包加速技術,提升指令處理效能,使運算更加高效。
- 全新雙媒體引擎,改進的編解碼技術,專為低延遲串流最佳化,影像品質在 AVC、H.264、H.265 格式上提升高達 25%,AV1 解碼吞吐量加倍。
- 第三代矩陣加速,支援新型 8-bit 浮點資料類型與結構化稀疏性 (Structured Sparsity),提升 AI 運算能力,並最佳化機器學習 (ML) 驅動的超解析度技術。
- 高速 GDDR6 記憶體,配備 16GB GDDR6,頻寬高達 256-bit @ 20 Gbps,並採用增強型記憶體壓縮技術,進一步提升效能與效率。
- AMD Radiance Display 引擎,支援 DisplayPort 2.1a 和 HDMI 2.1b,內建升級版影像縮放與銳化引擎,帶來更清晰流暢的視覺體驗。
- 最佳化的單晶片設計,採用 TSMC 4nm 製程,搭載 53.9 億顆電晶體,核心面積達 356.5 mm²,支援 PCIe Gen 5,實現更快的資料傳輸與更低功耗。
RDNA 4 帶來強化的遊戲串流與錄製能力,H.264 低延遲編碼品質提升 25%,HEVC (H.265) 編碼品質提升 11%,並透過 B 幀最佳化 AV1 編碼效率,在 720p 解析度下,整體編碼效能提升高達 30%。此外 RDNA 4 針對 FFMPEG、OBS 和 Handbrake 進行最佳化,確保更流暢的影像處理與串流體驗。
低功耗 VCN 影片播放引擎提供 AV1 與 VP9 超過 50% 的效能提升,同時降低上下文切換開銷與記憶體寫入需求。相較 RDNA 3,RDNA 4 在 1080p 500Kbps 低位元率下的 H.264 低延遲編碼也具備更優秀的表現,進一步提升影片品質與傳輸效率。
RDNA 4 進一步提升了 FreeSync 能效最佳化,在大多數雙顯示配置中,顯示卡的閒置功耗顯著降低。此外硬體翻轉隊列支援,使得影片幀排程可以轉交給 GPU 處理,從而節省 CPU 的功耗,特別在播放影片時更為高效。Radeon Image Sharpening 2 提供高品質的影像銳化,並且只需一個開關即可在所有 API 上啟用,進一步提升遊戲畫面細節。例如在 《Starfield》 中,啟用 RIS 2 能顯著增強畫面清晰度,無需額外的畫面銳化處理。
此運算引擎架構圖展示了多個關鍵模組,包括向量核心 (VCore)、標量核心 (SCore)、紋理處理單元、雙 SIMD32 向量單元和光線加速器改進等。這些模組緊密協作,提升了運算效能與效率。
- 左上角向量核心 (VCore) 包含 8 個超越邏輯單元 (TLUs) 和 32 個 算術邏輯單元 (ALUs),以及 32 個整數 / 浮點單元 (PMA / INTS)。標量核心 (SCore) 包括標量單元和 AI 加速器。
- 中間模組包括 32KB 的著色器指令緩存,以及同樣包含標量單元和 AI 加速器 的標量核心。
- 右上角是紋理處理單元,配備 32KB 的 L1 快取,並支援加載 / 儲存功能。
- 左下角包含雙 SIMD 32 向量單元,增強矩陣操作,支援 2x-16b 和 4x-8b / 4b 的密集矩陣速率,透過 4:2 結構化稀疏性提升 2 倍的運算速率。此外新增的 8b 浮點資料類型和矩陣加載 / 轉置功能,進一步提升了計算性能和效率。
- 下方模組包括標量單元更新,支援新型 Fused32 運算。
- 右下角光線加速器,改進提供了多項功能,例如分割與合併柵欄、加速光照 / FBR 操作、預取指令、硬體實例化變換、改進的 RT 堆疊管理、內建與流模式壓縮,以及定向 / 邊界框處理。
在現代遊戲中,光線追蹤 (Ray Tracing) 效果正日益普及,無論是控制台還是 PC 遊戲,越來越多的遊戲提供了光線追蹤選項,尤其在陰影、反射和全域光照上,許多遊戲大作已經採用了光線追蹤技術。
光柵化 (Rasterized) 技術提供了基礎的烘焙光照、光柵動態陰影、螢幕空間反射和光線追蹤動態陰影。
隨著技術發展,混合 (Hybrid) 解決方案開始加入了光線追蹤全域光照、光線追蹤動態反射,並實現了無限的幾何細節,同時還引入了神經網路放大與降噪技術。
在路徑追蹤與 AI 增強 (Path Traced & AI Augmented) 中,新的神經網路體積模擬和路徑追蹤全域光照,進一步提升了遊戲畫面的真實感,推動了圖形領域的技術革命。
目前我們處於近似路徑追蹤 (Path Tracing) 的初期階段,這一技術已經在一些遊戲中開始實現,為未來的遊戲圖形帶來更多的可能性。
RDNA 4 在光線追蹤領域進行了顯著提升,首先是增強的光線加速器,配備了 8 Ray / Box 和 2 Ray / Triangle 單元,達到 2 倍的性能增長。此外新增的專用硬體實例變換和光線硬體堆疊管理加速,進一步提升了效能。
在 BVH 結構與遍歷性能上,RDNA 4 采用了 BVH 8,有效減少了遍歷步驟並降低了延遲,並透過新型原始節點壓縮減小了 BVH 大小,同時引入定向邊界框 (Oriented Bounding Boxes) 來減少錯誤交集的情況。
另外 RDNA 4 也實現了加速著色,透過動態 VGPR 管理,提高了光線佔用率,並藉由無序記憶體回傳來進一步降低延遲。
相比 RDNA 3 (4-wide BVH),RDNA 4 的 8-wide BVH 顯著降低了相對 BVH 記憶體需求,使得性能表現更加高效,並且記憶體使用越低越好。
世界幾何形狀對遍歷成本有顯著影響,傳統的 BVH 邊界框通常是軸對齊的,必須包圍所有包含在內的幾何物件。然而對於那些未對齊世界軸的幾何物件,這些邊界框往往會膨脹,導致錯誤的交集判定 (即框內大多是空間)。
為了解決這一問題,AMD 引入了定向邊界框 (OBB),允許每個邊界框節點擁有唯一的方向。每個框中都會編碼一個旋轉,這樣可以更緊密地包圍其中的幾何物件。通過將邊界框對齊幾何物件,能夠有效去除許多空白區域,並且當光線進入邊界框時,會根據編碼的旋轉來轉換光線方向。
結果顯示,非軸對齊的幾何物件能夠更緊密地包含在邊界框中,平均遍歷步驟大幅減少,並且遍歷的峰值成本降低,從而消除了遍歷中的熱點。整體遍歷性能提升約 10%,具體取決於幾何物件的類型和配置。
記憶體請求的延遲對性能至關重要,特別是在光線追蹤工作負載中,這一因素尤為敏感。光線穿越 BVH 結構、著色的紋理和緩衝區請求等,都會受到記憶體延遲的影響。
RDNA 4 引入了額外的無序記憶體請求隊列,使得記憶體請求可以不再按照請求的順序回傳。與 RDNA 3 不同,RDNA 3 的資料回傳是按請求發起的順序排列的,這可能導致較短延遲的資料被長延遲請求所擠壓。
RDNA 4 允許來自不同著色器的請求無序回傳,這樣即便有長延遲的請求 (如未快取的葉節點訪問),也不會阻塞其他著色器的執行。這一變化顯著提升了 RDNA 4 在多數工作負載中的性能表現。
RDNA 4 的計算單元 (CUs) 在光線遍歷性能上提供了約 2倍的提升,相較於 RDNA 3 在相同時脈速度和頻寬下。
最終的光線追蹤性能取決於多個因素,包括幾何物件的方向對定向邊界框(OBB)影響、光線一致性的依賴關係等。
RDNA 4 架構在所有領域都進行了改進,為各種光線追蹤應用提供了更高的性能,無論是遊戲還是創作工作負載,都能實現更高效的光線追蹤處理。
觀察發現,光線追蹤著色器在運行中會出現暫存器需求的大幅波動。在遍歷階段,所需的暫存器較少,而在結果著色階段則需要更多的暫存器。
在 RDNA 3 中,著色器必須為最糟情況分配暫存器,而在 RDNA 4 中,著色器可以選擇動態分配暫存器。當需要暫存器時,它們可以從池中請求,並且在工作完成後可以將暫存器歸還池中。軟體會管理這一過程,處理可能需要等待分配的情況。
利用這一功能,RDNA 4 可以讓更多的波浪同時進行,從而提高佔用率,更有效地處理記憶體延遲,顯著提升著色器核心的整體效率。
RDNA 4 在 Radeon 和 Instinct 的基礎上,提供了全面的 AI 能力,專注於尖端的遊戲和內容創作模型。其增強的 WMMA (Wave Matrix Multiply Accumulate) 操作,能夠更緊密地協調矩陣運算和資料移動,達到最佳的效率和功率表現。
RDNA 4 支援 8 位浮點數格式,開啟了更多的新功能和更廣泛的應用,提供 E4M3 和 E5M2 兩種格式,分別針對不同範圍和精度需求。透過 4:2 結構化稀疏性,RDNA 4 提供高達 2 倍的峰值性能並改善每瓦性能,顯著提升 AI 驅動的運算效率。
在使用 SDXL 1.5 進行影像生成時,以 7900 XT 和 9070 XT 作為對照,RDNA 4 提供了接近 2 倍的每計算單元 (CU) 性能提升,特別是在 FP16 精度下。根據 UL Procyon SDXL FP16 測試結果,RDNA 3 的每計算單元性能為 1,而 RDNA 4 則達到了 2,展示出明顯的性能增強。
RDNA 4 與 AMD FidelityFX Super Resolution 4 結合,透過 FP8 Tensor 數學、激活函數、量化、反量化、轉換及元素級運算,提供了強大的超解析度 (SR) 能力。AMD 針對超解析度進行了訓練和最佳化,利用基於機器學習的 FSR 4 技術,實現了全新的影像品質提升。
在 AMD Instinct 加速器上訓練的自訂遊戲 ML 模型,透過 AMD Radeon RX 9070 XT 進行運算,為像《Call of Duty : Black Ops 6》這類遊戲大作提供 AI 增強的 4K 輸出。此技術能夠將低解析度的遊戲渲染顏色、深度和運動向量資料提升至驚人的 4K 視覺效果,極大地增強了遊戲體驗。
搭配 AMD FidelityFX Super Resolution 4 和畫面插幀技術,在《Ratchet & Clank(RT)》中,原生 4K 解析度下的畫面幀率為 39FPS。透過 FSR 4 升級,幀率提升至 78FPS,而結合 FSR 4 升級 + 畫面生成技術,幀率進一步躍升至 144FPS,實現了 3.7 倍的顯著提升,帶來更加流暢的遊戲體驗。
光線追蹤與路徑追蹤的區別,傳統的光線追蹤可以有多種形式,這裡展示的僅為其中一個範例。我們可以對場景中的每個像素進行此操作,從而創建影像。這些技術可用於處理反射、折射等效果。
與此不同,路徑追蹤以不同的方式使用光線追蹤硬體,它的目標是從所有可能的光線路徑中進行取樣。一種方法是對每個像素發射大量光線,並在每次交點處隨機選擇一條路徑進行取樣。這種方法成本高昂,但能提供對光傳輸的全面解決方案。
RDNA 4 路徑追蹤技術使用每個像素進行一次取樣,並結合了定向光網格取樣和神經輻射快取 (Neural Radiance Caching)。此外它還支援 Restir 直射光和全域光照的處理,並配備神經超解析度與降噪技術,以進一步提升畫面品質和處理效率。
RDNA 4 為下一代遊戲與創作打造,具備高效能的光線追蹤與機器學習技術。它擁有先進的計算能力、創新的光線追蹤功能,以及機器學習增強的超解析度技術。強大的記憶體容量能夠支援當今最具挑戰性的遊戲應用,並提供先進的影像編碼與串流功能,為生產力與媒體創作提供優異支援。這一切都在 AMD Radeon RX 9070 XT 中實現。
AMD RDNA 4 詳細解析 2
AMD 推動最具代表性的遊戲設備,涵蓋 PC、主機、行動裝置及掌機平台,為玩家提供全面的遊戲體驗。RDNA 4 為玩家打造頂級遊戲體驗,提升光線追蹤與機器學習技術,並加速每美元效能的領先地位,將高效能遊戲體驗帶給更多玩家。
專注於玩家需求,AMD 提供更具可及性的選擇,85% 的玩家選擇購買價格低於 700 美元的顯示卡。隨著更多玩家選擇 1440p 和 4K 顯示器,AMD 提升了顯示效能,並支援光線追蹤遊戲。更重要的是,簡單升級也成為現實,玩家只需使用現有的電源供應器 8-Pin 接頭,即可輕鬆升級。
AMD RDNA 4 架構引入全新計算單元,與 RDNA 3 相比,提升了記憶體子系統、改進了標量單元,並實現了動態暫存器分配。此外 RDNA 4 還提高了計算單元效率與時脈速度,帶來更強大的效能。
AMD RDNA 4 架構搭載第三代光線追蹤加速器,提供每個計算單元 2 倍的光線追蹤吞吐量。除了 2 倍增強的光線追蹤特性,還支援雙光線交叉,顯著提升基準效能。
AMD RDNA 4 架構配備第二代 AI 加速器,提供多項提升效能的功能。FP16 性能提升 2 倍,INT8 提升 4 倍,並在使用稀疏性技術時,FP16 和 INT8 分別提供 4 倍和 8 倍的效能增長。還引入了全新的 FP8 格式,進一步擴展 AI 運算能力。
AMD RDNA 4 架構搭載第三代光線追蹤加速器,提供比 AMD RDNA 3 高出 2 倍的光線追蹤效能。第二代 AI 加速器在啟用稀疏性技術的情況下,提供比 RDNA 3 快 8 倍的 AI 運算效能。增強的媒體引擎提升了最高 20% 的媒體品質 (VMAF)。RDNA 4 還支援 PCIe Gen 5、HDMI 2.1b 和 DisplayPort 2.1a 等先進技術,達成戰未來的目標。
AMD RADEON RX 9000 系列顯示卡
介紹 AMD Radeon RX 9070 系列,搭載 AMD RDNA 4 架構。
為 4K 遊戲提供 1440p 價格的最佳效能,搭載 AMD RDNA 4 架構。RX 7900 XTX 配備 96 個 RDNA 3 CU,57.8 億顆晶體管,發售價 $999;RX 7900 XT 配備 84 個 RDNA 3 CU,55.8 億顆晶體管,發售價 $899;RX 7900 GRE 配備 80 個 RDNA 3 CU,53.8 億顆晶體管,發售價為 $549。
而 RX 9070 系列則提供最高 64 個 RDNA 4 CU,最多具有 53.9 億顆晶體管,支援 4K 和 1440p 遊戲體驗,售價介於 $899 至 $549 之間。
AMD Radeon RX 9070
- AMD RDNA 4 計算單元:56
- 硬體光線追蹤加速器:56
- 硬體 AI 加速器:112
- 最大 AI TOPS (INT4 w/Sparsity):1165 TOPS
- 加速時脈:2.52GHz
- 顯示記憶體:16GB
- TBP:220W
- 連接性:PCIe 5.0 x16
- 顯示輸出:DisplayPort 2.1a, HDMI 2.1b
AMD Radeon RX 9070 XT
- AMD RDNA 4 計算單元:64
- 硬體光線追蹤加速器:64
- 硬體 AI 加速器:128
- 最大 AI TOPS (INT4 w/Sparsity):1557 TOPS
- 加速時脈:2.97GHz
- 顯示記憶體:16GB
- TBP:304W
- 連接性:PCIe 5.0 x16
- 顯示輸出:DisplayPort 2.1a, HDMI 2.1b
AMD Radeon RX 9070 在 4K 最大設定下,相較於 AMD Radeon RX 6800 XT ($649),提供高達 38% 更快的遊戲平均效能,跨越 30 多款遊戲;與 RTX 3080 ($699) 相比,則提供 26% 更快的遊戲平均效能,同樣跨越 30 多款遊戲。
在 4K 超高設定下,AMD Radeon RX 9070 相較於 RX 7900 GRE,提供高達 21% 更快的遊戲平均效能,跨越 30 款以上遊戲。
在 2K 超高設定下,AMD Radeon RX 9070 相較於 RX 7900 GRE,提供高達 20% 更快的遊戲平均效能,跨越 30 多款遊戲。
AMD Radeon RX 9070 XT 在 4K 最大設定下,相較於 AMD Radeon RX 6900 XT ($999),提供高達 51% 更快的遊戲平均效能,跨越 30 多款遊戲;與 RTX 3090 ($1499) 相比,則提供 26% 更快的遊戲平均效能,同樣跨越 30 多款遊戲。
在 4K 超高設定下,AMD Radeon RX 9070 XT 相較於 RX 7900 GRE,提供高達 42% 更快的遊戲平均效能,跨越 30 多款遊戲。
在 2K 超高設定下,AMD Radeon RX 9070 XT 相較於 RX 7900 GRE,提供高達 38% 更快的遊戲平均效能,跨越 30 多款遊戲。
AMD 軟體發展歷程,涵蓋了特性、效能與穩定性的演進。在 2000 年時,AMD 致力於基礎驅動程式的開發與簡單的效能增強;到 2010 年,進一步加強了顯示卡驅動程式的穩定性與遊戲效能,並引入了更多的功能與最佳化;進入 2020 年,AMD 持續推動高效能計算與 AI 加速,並推出更先進的軟體工具,提升遊戲體驗、創作效率和整體系統穩定性,實現了軟體與硬體的完美協同。
AMD HYPR-RX 提供超強效能,提升遊戲體驗,支援數千款遊戲。在 2025年新功能中,AMD Fluid Motion Frames 2.1 為遊戲帶來更流暢的畫面,更多創新功能即將登場。
AMD HYPR-RX 超強效能提升,搭配 RX 9070 XT 和 Ryzen 7 9800X3D,在 4K 最高設定下提供顯著的 FPS 提升。啟用 HYPR-RX 後,遊戲表現大幅加速:
- Microsoft Flight Sim 2024:121 FPS、提升 2.8 倍。
- Kingdom Come Deliverance 2:147 FPS、提升 2.6 倍。
- Star Citizen:170 FPS、提升 2.9 倍。
AMD FidelityFX Super Resolution 4,專為 AMD RDNA 4 顯示卡開發,基於機器學習的影像放大技術,結合幀生成與抗延遲功能,提供高品質且低延遲的影像。FSR 4 採用了可升級的 FSR 3.1 API,並已準備好支援神經渲染技術。
AMD Radeon RX 9070 XT 在 4K 原生解析度下提供 53 FPS 的平均幀率。啟用 AMD FSR 4 性能模式後,遊戲《Warhammer 40000 : Space Marine》的平均幀率提升至 182 FPS,實現了 3.4 倍的性能提升。
這是遊戲場景的對比圖,主要比較不同渲染技術下的影像品質。圖中展示了 3 種不同的渲染效果:
- Native 4K:原始的 4K 解析度影像。
- AMD FSR 3.1 Performance Mode:使用 AMD FidelityFX Super Resolution (FSR) 3.1 性能模式渲染的影像。
- AMD FSR 4 Performance Mode:使用 AMD FSR 4 性能模式渲染的影像。
這些渲染技術旨在提升遊戲的性能同時兼顧畫質。對比不同模式可以發現,影像的細節、清晰度和整體視覺效果各有差異。性能模式通常會犧牲部分畫質來換取更高的幀率,而品質模式則在保持較高畫質的同時提供穩定性能。而 AMD FSR 4 則突破傳統限制,實現高性能與優秀畫質兼具,帶來更流暢且細膩的遊戲體驗。
由 AMD FidelityFX Super Resolution 4 支援的超強 4K 遊戲體驗,在發佈時將支援 30 多款遊戲,並計劃在 2025 年推出 75 多款遊戲。
AMD Software Adrenalin Edition 帶來全新功能與強化性能,為 2025 年推出更多創新內容。遊戲內將支援 AMD FidelityFX Super Resolution 4,涵蓋 30 多款遊戲,並且 AMD FidelityFX Super Resolution 2 / 3 已支援超過 400 款遊戲。為了進一步增強遊戲體驗,2025 年的 AMD HYPR-RX 將支援數千款遊戲。
高更新率 4K 遊戲體驗,由 AMD Radeon RX 9070 XT 搭配 FidelityFX Super Resolution 4 和 AMD HYPR-RX 超強加速提供。在《Call of Duty : Black Ops 6》中,原生 4K 解析度下的 FPS 為 73,而啟用 AMD 的超解析度與幀生成技術後,FPS 上升至 222,達到 3 倍提升。
AMD Software 現在搭載 AI,提供更多功能、效能與穩定性提升。透過全新的 AI 最佳化內部測試流程,加強了軟體穩定性;並且 AMD Image Inspector 現已支援 AI 錯誤報告,讓使用者能夠主動選擇參與。AMD Chat 功能也已推出,為用戶提供啟用 AMD 軟體功能和更多選項的便利方式。
STREAM、RECORD、CREATE,一切需要的工具,讓你能夠分享最精彩的遊戲時刻。搭配增強型媒體引擎,提供高品質的 H.264 編碼、硬體 AVI 支援與 AI 影片過濾。AMD 桌上型 AI PC 配備頂尖的 AMD Ryzen 處理器和 Radeon 顯示卡,並透過 AMD 軟體進一步強化效能。還有由 AI 開發、具備雙向音頻過濾技術的 AMD 噪音抑制技術,為你的音訊體驗提供更清晰的效果。
增強媒體引擎,在 AMD RDNA 4 中相比 RDNA 3 提供了明顯的提升。它支援 H.264、HEVC 和 AV1 編解碼格式,並提供最高 8K 80FPS 的編解碼能力。此引擎不對會話數量或編碼流數量設限,可實現無縫的多任務處理。還包括加速的後處理效果,確保高品質的內容創作與流暢體驗。這使其成為一個全面的解決方案,適合進行遊戲直播、錄製以及分享你的精彩遊戲時刻。
AMD Radeon RX 7900 GRE 16GB 和 AMD Radeon RX 9070 XT 16GB 兩款顯卡在 AI 性能方面的比較,分為創作者 AI 性能和生成式 AI 性能兩部分:
- 在創作者 AI 性能方面,AMD Radeon RX 9070 XT 16GB 在 Super Resolution Adobe Lightroom、Denoise Adobe Lightroom、Subtitles from Audio Davinci Resolve 和 Magic Mask Tracking Davinci Resolve 中的性能分別提升了 112%、117%、120% 和 134%。
- 在生成式 AI 性能方面,該顯卡在 FLUX Schnell Amuse、ComputerVision FP16 Procyon、SD 1.5 Procyon 和 SD XL Procyon 中的性能分別提升了 141%、145%、164% 和 170%。
加速生成式 AI 涉及一系列先進技術,如離線多頭注意力、冗餘節點消除、智慧融合、量化、權重修剪以及自定義節點,如 Microsoft Olive 和 AMD 最佳化。AMD 最佳化的 ONNX 在其中發揮了關鍵作用,通過一個無縫的流程,從 Hugging Face 開始,經過 AI 框架,再到 AMD 最佳化的 ONNX。這一過程最終通過 AMD 驅動程式實現性能最佳化,充分發揮 GPU 的潛力。
加速生成式 AI,AMD 即將推出最佳化模型與 Model Zoo。AMD 針對 ONNX Runtime 執行進行 AI 模型最佳化,使 Radeon GPU 能夠高效運行影像生成模型。即將發布的 Model Zoo 和轉換工具將支援數百個 Stable Diffusion 檢查點,並涵蓋 SD 1.5、SDXL、SD 3.0、SD 3.5 等架構,未來還將擴展至 FLUX 和 LLMs,進一步提升 AI 運算效率。
終極遊戲平台,為全球玩家打造,AMD Radeon RX 9000 系列,搭載 AMD RDNA 4 架構,提供強大的遊戲效能。AMD FidelityFX Super Resolution 4 採用基於機器學習的影像放大技術,帶來更高畫質與流暢度。AMD Software Adrenalin Edition 提供強大效能、豐富功能與穩定性。而 AMD Ryzen 9000 X3D 則是全球最佳遊戲處理器,共同為玩家帶來領先的遊戲體驗。
AMD Radeon RX 9070 與 Radeon RX 9070 XT 將於 2025 年 3 月 6 日正式上市,並由多家合作夥伴推出,包括 Acer、ASRock、ASUS、GIGABYTE、PowerColor、SAPPHIRE、XFX、YESTO 盈通及瀚鎧 VASTARMOR,為玩家提供多樣化選擇。
總結
AMD 推出全新的 Radeon RX 9070 和 RX 9070 XT 顯示卡,採用 RDNA 4 架構,並帶來光線追蹤、機器學習 (AI)、高效能運算及影像放大技術的全面提升。RDNA 4 提供 3 代 光線追蹤加速器與 2 代 AI 加速器,並支援 PCIe 5.0、HDMI 2.1b 及 DisplayPort 2.1a 等戰未來技術。
此外,AMD 還透過 FidelityFX Super Resolution 4 與 HYPR-RX 技術,大幅提升遊戲畫質與效能,支援由 AI 驅動的超解析與幀生成技術,可在 4K 遊戲中帶來超過 3 倍的 FPS 提升。AMD 也加強了 AI 應用的最佳化,透過 ONNX Runtime 執行高效能 AI 模型,支援 Stable Diffusion 1.5、SDXL、SD3.0、SD3.5,未來還將支援 FLUX 與大型語言模型。
這些新技術的推出,使 Radeon RX 9000 系列成為更強大的遊戲與創作平台,並透過 ASUS、GIGABYTE、PowerColor、SAPPHIRE、XFX 等多家合作夥伴,於 2025 年 3/6 起全面上市,為全球玩家帶來更強大的遊戲體驗。
延伸閱讀