繼 RTX 5090 之後,緊接是 GeForce RTX 5080 顯示卡正式解禁,採用全新 GB203 繪圖核心,升級新一代 Blackwell GPU 架構,具備 10,752 CUDA Core,雖然和上代差距沒很大,但憑著第 4 代 RT Core、第 5 代 Tensor Core 及 16GB GDDR7 記憶體,在 DLSS 4 多幀生成技術加持下令 FPS 畫面幀率大幅提升。以下將以 RTX 5080 FE 跟上代 RTX 4080 SUPER 顯示卡進行對比測試。
NVIDIA GeForce RTX 5080 登場
NVIDIA 在 1/29 正式發布第二款 Blackwell GPU 架構、核心代號 GB203 的高階 GeForce RTX 5080 顯示卡,由於摩爾定律逐漸失效,傳統 GPU 設計已經無法以原生渲染方式維持理想的遊戲幀率,可以看到 RTX 5080 新卡相較上代 CUDA Core 數目相差不遠,NVIDIA 改向 Neural Rendering 神經渲染技術發展,將 AI 技術導入遊戲應用中,Microsoft 亦宣布在未來的 DirectX 中正式支援向量運算協作,完全解放 Tensor Cores 用於遊戲運算,GPU 硬體與 PC 遊戲界正迎來重大變革。
因此,NVIDIA 新一代 Blackwell GPU 非常著重於 Neural Rendering 神經渲染的性能提升,透過原生傳統渲染的一小部分成本生成絕大多數圖元。配合 DLSS 4 超解析度和 MFG 多幀生成技術,大幅提高遊戲幀率;再透過 DLSS 光線重建 (RR),通過使用先進的 AI 方法對缺少的細節進行降噪和重建,以更低的運算成本和記憶體佔用達成原生渲染級畫質。
此外,全新 Neural Rendering 神經渲染與 Neural Shaders 神經著色技術將加速遊戲開發人員對 AI 的應用,例如即時生成和新建各種地形、物理模擬、更複雜的 NPC 角色行為,甚至即時生成遊戲背景故事等等。Blackwell GPU 正在改變整個 PC 遊戲的生態發展。
與上代 RTX 4080 / RTX 4080 SUPER 相比,NVIDIA GeForce RTX 5080 在 Shader Cores 性能提升大約為 8~15%,雖然幅度不算顯著,但在 RT Core 和 Tensor Core 的全新 FP4 技術 (DLSS 4) 支援下,遊戲性能卻實現接近倍數增長。以下是 Blackwell GPU 的主要關鍵創新:
- 為神經渲染而生的全新 SM 單元︰大幅增強神經渲染運算能力。與 NVIDIA Ada GPU 相比,NVIDIA RTX Blackwell SM 在每個時鐘週期的整數數學輸送量提高了一倍,這對於提高神經著色中至關重要的位址生成工作負載性能極為有利。
- 全新第 4 代 RT Core︰Blackwell GPU 對 RT Core 架構進行了重大革新,帶來全新的光線追蹤體驗和神經渲染技術,進一步提升圖形性能。
- 全新第 5 代 Tensor Core︰引入全新的 FP4 功能,能將 AI 輸送量提升一倍,同時將記憶體需求減半。此外,Blackwell 的資料中心級 GPU 還搭載第二代 FP8 Transformer 引擎,進一步提升處理效能。
- NVIDIA DLSS 4︰全新 NVIDIA RTX Blackwell 架構支援 AI 多幀生成功能,能將 DLSS 4 的幀速率提升至上一代 DLSS 3 / 3.5 的兩倍,同時保持甚至超越原生畫質,並確保低系統延遲。
- RTX 神經著色器︰引入小型神經網路至可程式化著色器,開啟 GPU 圖形運算的新時代,為遊戲開發者提供更靈活的創作工具。
- AI 管理處理器 (AMP)︰AMP 支援多個 AI 模型 (包括語音、翻譯、視覺、動畫、行為等) 與圖形工作負載同時共用 GPU,提升多任務處理能力。
- GDDR7 記憶體︰採用全新的超低電壓 GDDR 顯示記憶體標準,並使用 PAM3 (脈衝幅度調製) 訊號技術,實現更高速的顯示記憶體子系統,同時進一步提升能效。
- Mega Geometry 技術︰一種新的 RTX 技術,旨在大幅提升光線追蹤應用中的幾何細節,帶來更逼真的視覺效果。
GeForce RTX 5080 定價 US$ 999
定價方面,NVIDIA 將會於 1 月 30 日正式發佈 GeForce RTX 5080 及 GeForce RTX 5090 / 5090 D 顯示卡。GeForce RTX 5080 型號基於 GB203 繪圖核心,擁有 10,752 個 CUDA Cores、16GB GDDR7 記憶體,MSRP 定價 US$ 999。官方宣稱其性能等同於 RTX 4080 的兩倍。
GeForce RTX 5090 / 5090 D 型號則基於 GB202 繪圖核心,擁有 21,760 個 CUDA Cores、32GB GDDR7 記憶體,MSRP 定價 US$ 1,999,官方聲稱可實現 4K 240Hz 特效全開並啟用 Path Tracing。
緊接著,NVIDIA 將於 2 月發佈 GeForce RTX 5070 及 GeForce RTX 5070 Ti 顯示卡。兩者同樣採用 GB205 繪圖核心。GeForce RTX 5070 型號擁有 6,144 個 CUDA Cores、12GB GDDR7 記憶體,MSRP 定價 US$549,官方聲稱其性能等同於 RTX 4090。GeForce RTX 5070 Ti 型號則擁有 8,960 個 CUDA Cores、16GB GDDR7 記憶體,MSRP 定價 US$749,官方宣稱其性能等同於 RTX 4070 Ti 的兩倍。
需要注意的是,以上性能宣稱均基於 DLSS 4 的情況下作出的。
TSMC 4N 製程、NVIDIA GB203 繪圖核心
NVIDIA GB203 繪圖核心基於全新 Blackwell 微架構,並應用於 GeForce RTX 5080 系列產品之中。由於今代仍維持採用 TSMC 4N 製程,CUDA Core 運算單元的數目提升幅度相當有限,加上時脈亦相差無幾,因此傳統光柵圖形運算性能提升只有約 8~15% 提升,主要的遊戲性能提升仍是來自第 4 代 RT Cores 與第 5 代 Tensor Cores,光線追蹤性能以及神經渲染運算能力大約提升了近 1 倍。
GB203 GPU 晶片尺寸為 378 mm²、電晶體數目為 456 億個,數字與上代 AD103 大致相仿。GeForce RTX 5080 採用了完整的 GB203 晶片,包含了 7 個圖形處理集群 (GPC)、42 個紋理處理集群 (TPC)、84 個串流多處理器 (SM),總計 10,752 個 CUDA Cores、84 個 RT Cores、336 個 Tensor Cores 及 336 個 Texture Units。
GB203 GPU 還包括 168 個 FP64 核心 (每個 SM 配備兩個),這些核心並未被描繪在上圖內。此外,FP64 的 TFLOP 速率是 FP32 操作 TFLOP 速率的 1/64,並包含少量 FP64 核心及極少量的 FP64 Tensor Core,以確保任何用到 FP64 的程式能夠正常運作。
在核心時脈方面,GeForce RTX 5080 所採用的 GB203-400 晶片時脈相較上代略為提升,預設時脈為 2,295MHz、Boost 時脈為 2,617MHz,最高 TGP 為 360W。
此外,GeForce RTX 5080 採用了 30Gbps 的 GDDR7 記憶體,配備 256-bit 記憶體介面、總頻寬達 960GB/s,L2 Cache 容量為 64MB。如此大記憶體頻寬令所有應用程式均能受益,尤其是在光線追蹤 (特別是路徑追蹤) 等複雜操作中,將帶來巨大的性能提升。
GeForce RTX 5080 vs GeForce RTX 4080 / 4080 SUPER vs GeForce RTX 3090 規格
Graphics Card | NVIDIA GeForce RTX 3080 | NVIDIA GeForce RTX 4080 | NVIDIA GeForce RTX 4080 SUPER | NVIDIA GeForce RTX 5080 |
GPU Codename | GA102 | AD103 | AD103 | GB203 |
GPU Architecture | NVIDIA Ampere | NVIDIA Lovelace | NVIDIA Lovelace | NVIDIA Blackwell |
GPCs | 6 | 7 | 7 | 7 |
TPCs | 34 | 38 | 40 | 42 |
SMs | 68 | 76 | 80 | 84 |
CUDA Cores / SM | 128 | 128 | 128 | 128 |
CUDA Cores / GPU | 8704 | 9728 | 10240 | 10752 |
Tensor Cores / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 272 (3rd Gen) | 304 (4th Gen) | 320 (4th Gen) | 336 (5th Gen) |
RT Cores | 80 (2nd Gen) | 76 (3rd Gen) | 80 (3rd Gen) | 84 (4th Gen) |
GPU Boost Clock (MHz) | 1710 | 2505 | 2550 | 2617 |
Peak FP32 TFLOPS (non-Tensor) | 34.1 | 48.7 | 52.2 | 56.3 |
Peak FP16 TFLOPS (non-Tensor) | 34.1 | 48.7 | 52.2 | 56.3 |
Peak BF16 TFLOPS (non-Tensor) | 34.1 | 48.7 | 52.2 | 56.3 |
Peak INT32 TOPS (non-Tensor) | 17 | 24.4 | 26.1 | 56.3 |
RT TFLOPS | 58.1 | 112.7 | 160 | 170.6 |
Peak FP4 Tensor TFLOPS with FP32 Accumulate (FP4 AI TOPS) | N/A | N/A | N/A | 900.4/1801² |
Peak FP8 Tensor TFLOPS with FP16 Accumulate | N/A | 389.9/779.8² | 418.0/836.0² | 450.2/900.4² |
Peak FP8 Tensor TFLOPS with FP32 Accumulate | N/A | 194.9/389.8² | 209.0/418.0² | 225.1/450.2² |
Peak FP16 Tensor TFLOPS with FP16 Accumulate | 119.1/238.2² | 194.9/389.8² | 209.0/418.0² | 225.1/450.2² |
Peak FP16 Tensor TFLOPS with FP32 Accumulate | 59.5/119² | 97.5/195² | 104.5/209.0² | 112.6/225.1² |
Peak BF16 Tensor TFLOPS with FP32 Accumulate | 59.5/119² | 97.5/195² | 104.5/209.0² | 112.6/225.1² |
Peak TF32 Tensor TFLOPS | 29.8/59.6² | 48.7/97.4² | 52.3/104.5² | 56.3/112.6² |
Peak INT8 Tensor TOPS | 238.1/476.2² | 389.9/779.82² | 418.0/836.0² | 450.2/900.4² |
Frame Buffer Memory Size and Type | 10 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR7 |
Memory Interface | 320-bit | 256-bit | 256-bit | 256-bit |
Memory Clock (Data Rate) | 19 Gbps | 22.4 Gbps | 23 Gbps | 30 Gbps |
Memory Bandwidth | 760 GB/sec | 716.8 GB/sec | 736.3 GB/sec | 960 GB/sec |
ROPs | 96 | 112 | 112 | 112 |
Pixel Fill-rate (Gigapixels/sec) | 164.2 | 280.6 | 285.6 | 293.1 |
Texture Units | 272 | 304 | 320 | 336 |
Texel Fill-rate (Gigatexels/sec) | 465.12 | 761.5 | 816 | 879.3 |
L1 Data Cache/Shared Memory | 8704 KB | 9728 KB | 10240 KB | 10752 KB |
L2 Cache Size | 5120 KB | 65536 KB | 65536 KB | 65536 KB |
Register File Size | 17408 KB | 19456 KB | 20480 KB | 21504 KB |
Video Engines | 1 x NVENC (7th Gen) | 2 x NVENC (8th Gen) | 2 x NVENC (8th Gen) | 2 x NVENC (9th Gen) |
TGP (Total Graphics Power) | 320 W | 320 W | 320 W | 360 W |
Transistor Count | 28.3 Billion | 45.9 Billion | 45.9 Billion | 45.6 Billion |
Die Size | 628.4 mm² | 378.6 mm² | 378.6 mm² | 378 mm² |
Manufacturing Process | Samsung 8nm Custom Process | TSMC 4nm 4N NVIDIA Custom Process | TSMC 4nm 4N NVIDIA Custom Process | TSMC 4nm 4N NVIDIA Custom Process |
PCI Express Interface | Gen 4 | Gen 4 | Gen 4 | Gen 5 |
NVIDIA GeForce RTX 5080 Founder's Edition
NVIDIA GeForce RTX 5080 Founder's Edition 散熱器厚度減至 2 Slot,雖然設計大改但保留了 RTX 40 系列的設計語言,邊緣採用鈦金色鋁金屬框架,並且印有 RTX 5080 字樣,正面中央腰身位置兩側增設由霧黑色的 CNC 金屬遮罩,覆蓋內裡的散熱鰭片令外觀更簡潔,採用全新 Double Flow Through 設計,正面具有 2 顆 12 cm 散熱風扇,令更多氣流可以通過顯示卡的 PCB,加強散熱效果。
GeForce RTX 5080 Founder's Edition 的長度及寬度與 RTX 4080 Founder's Edition 一樣,不過厚度縮減為 2 Slot,配搭雙 12 cm 軸向式散熱風扇,頂端 GeForce RTX 字樣及正面中央區域在運作時會透出白色 LED 燈效。
採用 2 Slot、雙風扇散熱器設計,尺寸為 304 x 137 x 48 mm、但由於散熱器基本上採用全金屬材料令重量達 1,648g,符合 NVIDIA SFF-Ready 規範,能夠相容 SFF-Ready 規格的小型機殼。
全新 Double Flow Through 散熱器將 PCB 移到置中位置,散熱器近前端及後端位置皆具備大面積散熱開口,令 2 顆風扇均可將氣流吹至穿透散熱器。
採用經過改進的 12VHPWR / 12V-2x6 接頭,具有向內偏移 1.7 mm 的感應接腳,更短的感應接腳可以檢測連接器是否完全插入,加入傾斜角度將埠口線材收藏在外殼內,令外觀更整齊之餘,亦更方便小機殼的用家。
NVIDIA 隨 GeForce RTX 5080 Founder's Edition 附了一條 PCIe 8-Pin x 3 轉 12VHPWR / 12V2x6 轉接線 (450W),轉接線採用全新設計,改用更柔軟的編織線,使用者不需再為線材太硬不方便彎曲而煩惱。
提供了 3 組 DisplayPort 2.1b + DSC 及 1 組 HDMI 2.1b 影像輸出埠口,兩種輸出介面皆可提供最高 8K@165Hz 12-bit HDR 解析度輸出,支援 VESA DSC 1.2 無損壓縮顯示功能,單一 DisplayPort 2.1b 埠口亦可提供最高 4K@480Hz 12-bit HDR 解析度輸出,單卡能提供最高 2 個 8K@100Hz HDR 顯示輸出。
2 Slot、Double Flow Through 散熱器
NVIDIA 這代 Founder's Edition 顯示卡改用全新 Double Flow Through 設計,在散熱器變得更薄的同時加強了氣流的穿透程度,令更大量的氣流可以穿透顯示卡,NVIDIA 聲稱新設計可壓制高達 600W 的發熱量。
由於 NVIDIA GeForce RTX 5080 Founder's Edition 的 PCB 位於置中位置,無法將主要元件、PCIe 金手指及 I/O 同時放在同一塊 PCB 上,因此 NVIDIA 採用了子母板的設計,以排線將連接主 PCB 及 PCIe、I/O 介面 2 塊子板,設計相當巧妙。
NVIDIA GeForce RTX 5080 Founder's Edition 顯示卡用上 2 Slot、雙風扇散熱設計的 Double Flow Through 散熱器,採用大面積銅底連接 5 支導熱管,再貫穿到前後 2 組散熱鰭片,提供了極大的散熱面積,配搭 2 顆 12cm 風扇,讓氣流穿過卡身排向 CPU 區域。
16 + 3 相供電
NVIDIA GeForce RTX 5080 Founder's Edition 顯示卡採用 PG144-SKU45 公板 PCB 設計,具備 18 相 DrMOS 供電模組,其中 15 相為 GPU 供電、3 相為 GDDR7 供電,採用 MPS MP29816 PWM 控制器配搭 18 組 MPS MP87993 DrMOS 晶片,為顯示卡提供穩定的供電輸出。
NVIDIA GB203-400 繪圖核心
NVIDIA GeForce RTX 5080 採用 GB203 繪圖核心,核心編號為 GB203-400-A1,沿用 TSMC 4N NVIDIA Custom 製程,擁有 456 億個電晶體,Die Size 為 378 mm²。RTX 5080 採用完整的 GB203 晶片,擁有 7 個 GPC 單元、42 個 TPC 紋理處理群集及 84 個 SM 串流多處理器,總計 10,752 個 CUDA Cores、84 個 RT Cores 及 446 個 Tensor Cores。
核心時脈方面,GeForce RTX 5080 預設時脈為 2,295MHz Base Clock、2,617MHz Boost Clock,支援 GPU Boost 4.0 技術可因應負載自動超頻至更高時脈,最高 TDP 為 360W。
256-bit 16GB GDDR7 記憶體容量
記憶體方面,GeForce RTX 5080 具備 16GB GDDR7 記憶體容量及 256-bit 記憶體控制器,記憶體頻寬達 960GB/s,配搭 64MB L2 Cache 容量,以滿足更高解析度、更複雜的着色器渲染運算畫面。
配備 8 顆 Samsung GDDR7 512M x 32 記憶體顆粒,編號為 K4VAF325ZC-SC28,單顆容量為 16Gbit (2GB),採用 266-Ball FBGA、官方規格為 28Gbps,總共提供 16GB 顯示記憶體容量。
效能測試
除了 NVIDIA GeForce RTX 5080 Founder's Edition 顯示卡,同時亦找來上代 RTX 40 系顯示卡作對比測試,以了解新一代 GeForce RTX 5080 的效能水準。此次測試使用 MSI MEG Ai1600T PCIE5 1650W 電源供應器,特別感謝 MSI 提供。
時脈方面,NVIDIA GeForce RTX 5080 Founder's Edition 預設核心時脈為 2,295MHz 基礎時脈、2,617MHz 加速時脈,最高 Power Limit 預設為 360W,可在 -17% 至 +8% 作出調整。
散熱方面,NVIDIA GeForce RTX 5080 Founder's Edition 在約 20°C 的室溫環境下閒置約 30 分鐘,GPU 溫度維持在 37°C。接著採用 Furmark 2 進行 3D 負載測試,將 GPU 完全負載 25 分鐘後,溫度則提升至 72°C,GPU 時脈保持在 2,287MHz。
*由於 FurMark 2 及 GPU-Z 目前版本還沒能完全支援 RTX 50 系顯示卡,目前部分讀取資訊並不準確,僅供參考。
測試平台:
- AMD Ryzen 7 9800X3D CPU (4.7GHz ~ 5.2GHz 8C16T 120W TDP)
- ASUS ROG CROSSHAIR X870E HERO Motherboard (BIOS ver. 1001)
- iGame GeForce RTX 5090 D Advanced (2.0GHz ~ 2.4GHz 575W TDP)
- NVIDIA GeForce RTX 5080 FE (2.2Ghz ~ 2.6Ghz)
- NVIDIA GeForce RTX 4090 FE (2.2GHz ~ 2.5GHz 450W TDP)
- NVIDIA GeForce RTX 4080 SUPER FE (2.2Ghz ~ 2.5Ghz 320W TDP)
- G.SKILL TRIDENT Z5 NEO DDR5-6000 CL30-38-38-96 16GB x 2 @ 1.25V
- ASUS ROG RYUJIN III 360 Cooler
- MSI MEG Ai1600T PCIE5 1650W PSU
系統使用 Windows 11 Professional 24H2,驅動版本 NVIDIA Game Ready Driver 572.02 WHQL,其他設定方面,測試啟用了 PBO 及 Resizable BAR,VBS 在 Windows 及 BIOS 中皆被關閉。
3DMark
Fire Strike
Time Spy
Steel Nomad
3DMark 作為最廣泛的 3D 性能基準測試,性能對比結果當然不可缺少,根據測試顯示 GeForce RTX 5080 遊戲性能相較上代 RTX 4080 SUPER 有一定提升幅度。
遊戲測試
以下遊戲測試除另外標示,否則皆採用光柵化設定,並關閉任何 Upscaling 及 Frame Generation 技術。
Cyberpunk 2077
Cyberpunk 2077 (1440p)
DirectX 12, Ultra
Cyberpunk 2077 (2160p)
DirectX 12, Ultra
Black Myth : Wukong
Black Myth Wukong (1440p)
DirectX 12, High
Black Myth Wukong (2160p)
DirectX 12, High
Dragon Age : The Veilguard
Dragon Age : The Veilguard (1440p)
DirectX 12, Ultra
Dragon Age : The Veilguard (2160p)
DirectX 12, Ultra
Star Wars Outlaws
Star Wars Outlaws (1440p)
DirectX 12, Ultra
Star Wars Outlaws (2160p)
DirectX 12, Ultra
F1 23
F1 23 (1440p)
DirectX 12, Ultra High
F1 23 (2160p)
DirectX 12, Ultra High
Forza Horizon 5
Forza Horizon 5 (1440p)
DirectX 12, Extreme
Forza Horizon 5 (2160p)
DirectX 12, Extreme
Marvel's Spider-Man : Miles Morales
Marvel's Spider-Man : Miles Morales (1440p)
DirectX 12, Very High
Marvel's Spider-Man : Miles Morales (2160p)
DirectX 12, Very High
Alan Wake 2
Alan Wake 2 (1440p)
DirectX 12, High
Alan Wake 2 (2160p)
DirectX 12, High
Watch Dogs Legion
Watch Dogs Legion (1440p)
DirectX 12, Ultra
Watch Dogs Legion (2160p)
DirectX 12, Ultra
CS2
CS2 (1440p)
DirectX 11, High
CS2 (2160p)
DirectX 11, High
Rainbow Six Siege
Rainbow Six Siege (1440p)
DirectX 11, High
Rainbow Six Siege (2160p)
DirectX 11, High
3DMark Raytracing 測試
3DMark
Raytracing Test
3DMark DLSS 測試
3DMark
DLSS Feature Test
光線追蹤遊戲測試
所有遊戲測試中皆啟用了光線追蹤功能,GeForce RTX 50 系列顯示卡採用最新的 DLSS 4,GeForce RTX 40 系列顯示卡則採用原有的 DLSS 3 技術。
Cyberpunk 2077
Cyberpunk 2077 (1440p)
DirectX 12, RT Overdrive, Transformer Model
Cyberpunk 2077 (2160p)
DirectX 12, RT Overdrive, Transformer Model
Dragon Age : The Veilguard
Dragon Age : The Veilguard (1440p)
DirectX 12, Ultra, TAA
Dragon Age : The Veilguard (2160p)
DirectX 12, Ultra, TAA
Star Wars Outlaws
Star Wars Outlaws (1440p)
DirectX 12, Ultra
Star Wars Outlaws (2160p)
DirectX 12, Ultra
Alan Wake 2
Alan Wake 2 (1440p)
DirectX 12, High
Alan Wake 2 (2160p)
DirectX 12, High
生產力測試
Davinci Resolve Studio 19
Davinci Resolve Studio 19
4:2:2 H.265 Rendering
測試採用 DaVinci Resolve Studio 19 影片剪輯軟體,分別以 Hardware Encoder 及 Voukoder Pro Plug-in 輸出 4:2:2 H.265 編碼格式的 4K60 影片,輸出時間愈少愈好;結果顯示 RTX 5080 在使用 Voukoder Pro Plug-in 時較 RTX 4090 / 4080 SUPER 快約 6%;RTX 40 系列顯示卡的 Hardware Encoder 並不支援 YUV 4:2:2 編碼,因此該項目沒有有任何分數。
Blender
Blender
4.3.0
測試採用 Blender Benchmark Tool 3.1.0,為 3D 繪圖軟體 Blender 提供的免費基準測試軟體,用於建立和渲染3D模型、動畫、遊戲、視覺效果等,以 monster、junkshop、classroom 三個場景專案進行跑分。
V-Ray 6
V-Ray 6
V-Ray 是一款圖像渲染外掛軟體,主要運用材質、光源等擬真效果,來呈現更貼近真實的設計畫面,經常會應用於室內設計、建築外觀 3D 模擬或電影特效設計等領域。
*以 NVIDIA Blackwell 顯示卡執行 V-Ray 6「CUDA」項目時分數過低為 NVIDIA 官方已知問題。
UL Procyon Image Generation
UL Procyon
AI Image Generation
UL Procyon AI Image Generation Benchmark 基準測試中,採用 Stable Diffusion text-to-image 模型工具來測試 AI 圖像生成的性能,測試採用 FLUX 1.Dev (FP8)、FLUX 1.Dev (FP4)、Stable Diffusion 1.5 (FP16) 及 Stable Diffusion XL (FP16) 測試模型,分別以 FP8 或 FP4 生成 4 張 1024 x 1024 解析度的圖片,數字愈小愈好。
UL Procyon AI Text Generation
UL Procyon
AI Text Generation
UL Procyon AI Text Generation Benchmark 基準測試使用參數大小各不相同的 4 種業界標準 AI 模型 (LLM 大型語言模型) 進行測試,分別是 Phi-3.5-mini、Mistral 7B、Llama-3.1-8B、Llama-2-13B,並執行 7 個 Prompt 以模擬多個現實世界的用例,包括 RAG (檢索增強生成) 和非 RAG 查詢,測試採用 ONNX Runtime AI 推理引擎。
總結
對比上代 RTX 4080 SUPER,NVIDIA GeForce RTX 5080 在 2160p 的解析度下的提升約為 11% 左右,在 1440p 解析度下的提升更僅有約 7%,光線追蹤性能更只有少量提升,整體性能未能挑戰上代旗艦 RTX 4090,功耗更由上代的 320W 提升至 360W,單論物理性能的話,説它是一張「RTX 4080 Ti」似乎並沒有任何違和感。不過對比一下 RTX 5080 與 RTX 4080 SUPER 的核心配置,這個程度的性能提升似乎亦在意料之中,畢竟 RTX 5080 最大的殺手鐗必然是全新的 Multi Frame Generation 技術與新一代的 NVENC 編碼器,若你常玩的遊戲將加入 DLSS 4 以及 MFG 技術,RTX 5080 絕對可以讓你在高解析度下流暢遊玩,對 RTX 30 系列或更舊顯示卡的用家而言會是個有感的升級,不過以 US$ 999 的 MSRP (NT$ 35,990 起),對於用不著新功能的使用者而言,上一代的 RTX 4080 SUPER 性價比相對更高。
以上內容及測試數據為 HKEPC 獨家授權給 UNIKO's Hardware 編譯