由於老黃刀法過於精準,RTX 40 中高階型號吸引力有限,加上市面上還是有一些 RTX 30 系列,價格與性能差距不夠大,迫使 NVIDIA 推出 RTX 40 SUPER 救市。該系列首張登場的是 GeForce RTX 4070 SUPER 顯示卡,升級至 AD104-350 繪圖核心,CUDA Core 增加至 7,168 個,並具備 56 個 RT Core 及 224 個 Tensor Core,規格提升但售價卻不變,建議售價維持在 US$ 599。此次找來 RTX 4070 和 4070 Ti 一同進行對比測試,幫助大家了解性能差異。
首波主打 RTX 4070 SUPER
NVIDIA 1/16 正式發布全新中階顯示卡 GeForce RTX 4070 SUPER,這是 RTX 40 SUPER 系列的第一炮,其 CUDA Core 數目相較 RTX 4070 提升 20% 但加量不加價,建議售價保持在 US$ 599,緊接下來還會有 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 型號登場。此系列還首次出現 Ti SUPER 命名,很多人以為 SUPER 是型號定位在 Ti 之下,原來 NVIDIA 官方將 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。
有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但資料卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,舉例 RTX 2070 是 TU102 Full Chip 規模的 50%,RTX 3070 是 GA102 Full Chip 規模的 54.76%,沒想到 RTX 4070 竟然只有 AD102 Full Chip 規模的 31.94%,晶片規模甚至低於舊代 RTX 2060 (41.67%) 及 RTX 3060 (33.33%) 、相當可憐。
過去 NVIDIA 中階新卡可以完全吊打舊代效能級甚至高階型號,但 RTX 4070 卻完全沒有這個能力,性能的提升更多來自 DLSS 3 技術的加持,主要原因是上代庫存太多,RTX 40 規格也留手讓 AIC 有機會清貨 。根據 NVIDIA 官方資料表示,當啟用 DLSS 3 的 Frame Gen 後,GeForce RTX 4070 在 2K 解析度下平均較 GeForce RTX 3080 快 40%,沒有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在遊戲市場要取得銷售成功,很大程度視乎 NVIDIA DLSS 3 技術的普及程度,
礦難後大量二手卡湧現、舊代 RTX 30 庫存減價,加上全球經濟低迷,市場明顯對 RTX 40 中高階型號興趣缺缺,以往是 RTX 20 / 30 的中高階型號性價比吸引,旗艦級型號不求性價比目標是追求極致性能的金主們,但 RTX 40 卻是中高階型號性價比不足,顯得 RTX 4090 性價比更為出色,就算售價是 US$1,599 甚至還被炒高也是大賣,玩家們並非沒錢只是找不到升級的理由。
撥亂反正的 RTX 40 SUPER
對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 將用來取代舊型號,RTX 4070 Ti 及 RTX 4080 會完全停產,RTX 4080 SUPER 的建議售價會降至 US$ 999,當年 RTX 4080 只有 9,728 個 CUDA + 256-bit 16GB 敢賣 US$ 1,199,真是靜茹給的勇氣!
GeForce RTX 4070 SUPER 是三張 SUPER 之中進步最大的一張,CUDA Core 相較 RTX 4070 增加了 20%,回到 AD102 Full Chip 規格的 38.89%,建議售價 US$ 599 會取代 RTX 4070 原有定位,但 GeForce RTX 4070 並不會停產,而是向下降至 US$ 499,整個佈局令 NVIDIA RTX 40 產品線回復吸引力,令人期待。
NVIDIA AD104-350 繪圖核心
與 RTX 4070 / RTX 4070 Ti 一樣,GeForce RTX 4070 SUPER 同樣採用 AD104 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,性能提升主要來自 FP32 運算單元數目及時脈倍增,更大的 L2 Cache 容量及全新著色器執行排序技,術,升級第 3 代 RT Cores、升級第 4 代 Tensor Cores,與上代比較 Ampere GPU 微架構比較,傳統光柵圖形運算提高了 2 倍,同時在光線追蹤性能上提升近 4 倍。
採用 TSMC 4N NVIDIA Custom 製程,擁有 358 億個電晶體、 Die Size 294.5 mm² 與上代 GeForce RTX 3060 的 GA106-300 Die Size 276 mm² 相差不大,完整的 AD104 晶片內建 5 個 GPC 單元、 30 個 TPC 紋理處理群集及 60 個 SM 串流處理器,具備 7,680 個 CUDA Core、60 個 RT Core 及 240 個 Tensor Core。
GeForce RTX 4070 SUPER 採用 AD104-350 繪圖核心,規模相較 RTX 4070 大幅增加,回復至 5 個 GPC 單元、增至 28 個 TPC 紋理處理群集及 56 個 SM 串流處理器,具備 7,168 個 CUDA Core、56 個 RT Core、224 個 Tensor Core、224 個 Texture Unit 及 80 個 ROP。
核心時脈方面,NVIDIA GeForce RTX 4070 SUPER FE 預設時脈 1,980MHz、Boost 時脈為 2,475MHz,最高 TDP 220W 相較 RTX 4070 高了 20W。
記憶體方面,NVIDIA GeForce RTX 4070 與 RTX 4070 SUPER 一樣維持 192-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,最高記憶體頻寬為 504GB/s,但 RTX 4070 SUPER 的 L2 Cache 容量由 36MB 提至 48MB,有助提升遊戲 Workload 資料命中率,降低讀取延遲並減少 GDDR6X 記憶體頻寬使用,記憶體子系統性能相較 RTX 4070 有明顯改善。
GeForce RTX 4070 SUPER Founder Edition
收到由 NVIDIA 送測的 GeForce RTX 4070 SUPER Founder Edition 顯示卡,由於 NVIDIA 把 RTX 40 SUPER 定義為半代更新,因此外觀設計上與 RTX 40 有明顯差異,和早前坊間流出、已胎死腹中 RTX 3090 Ti 原型一樣,整張卡都被「黑化」了,採用陽極化霧黑色金屬框架,X 框架亦變成電鍍亮黑面,在光源下會呈現亮面反射效果,坦白說質感更上一層樓。
卡的正面都是霧黑色的散熱鰭片,設計 RTX 4070 完全一樣沿用軸向式散熱設計,背面 RTX 4070 字樣只有坑紋沒有填色、SUPER 則是 Highlight 效果立體凸出,正反兩面各有一個 10 cm 軸向式散熱風扇,能夠將部份廢熱排向 CPU 區域及直接排出機殼,令機殼內部溫度變得更平均。
NVIDIA GeForce RTX 4070 SUPER Founder Edition 尺寸和 RTX 4070 FE 一樣,Dual Slot 設計、 244 x 112 x 40 mm、重量為 1,014g,大部份 A4 小型機殼都可以放得下,官方資料指出在閒置下功耗大約 11W,播放影片約 16W,遊戲平均功耗 (AGP) 約 200W,最高 TGP 為 220W,建議使用 650W 或以上電源供應器。
考慮到大部份人安裝顯示卡後,從機殼外看進去只會看到卡背,NVIDIA 將設計反轉了把背板變成正面,朝上顯示「RTX 4070 SUPER」字樣,整張卡所有螺絲孔都用磁吸隱藏了,NVIDIA 真的是從使用者的角度、在細節中作出了考量,難怪那麼多玩家想買 Founder Edition。
NVIDIA PG141 公板設計
拆開散熱器,可以看到 GeForce RTX 4070 SUPER Founder Edition 採用 PG141 公板設計,NVIDIA 刻意將電路板盡量縮小,卡身的褸空可讓軸向式風扇將帶氣流帶到 CPU 區域,採用低阻抗 8 Layers PCB 設計,提供訊號及電力傳輸最佳化,同時保留了不俗的超頻性能。
供電設計方面,GeForce RTX 4070 SUPER Founder Editon 增至 7 相為 GPU 供電、2 相為 GDDR6X 供電,全面採用 OnSemi NCP302150 DrMOS,在單一封裝內加入上下橋 MOSFET 及集成驅動器,單相能提供 50A 持續電流輸出。
NVIDIA AD104-350 繪圖核心
GeForce RTX 4070 使用 AD104-350 繪圖核心,採用 TSMC 4N 製程、擁有 358 億個電晶體、Die Size 約為 295 mm²,相較 RTX 4070 的 AD104-250 繪圖核心,運算單元數目增加約 20%,由 4 個 GPC 單元減至 5 個、共 28 個 TPC 紋理處理群集及 56 個 SM 串流處理器,具備 7,168 個 CUDA Core、56 個 RT Core、 224 個 Tensor Core、224 個 Texture Unit 及 80 個 ROP。
時脈方面,NVIDIA GeForce RTX 4070 SUPER Founder Edition 預設基礎時脈為 1,980MHz、加速時脈 2,475MHz,支援 GPU Boost 4.0 技術,可因應負載自動超頻至更高時脈,Power Limit 預設為 220W。
192-bit 12GB GDDR6X 記憶體容量
記憶體方面,GeForce RTX 4070 SUPER 與 RTX 4070 一樣支援 192bit 記憶體控制器、12GB GDDR6X 記憶體容量,但 L2 Cache 容量由 36MB 增至 48MB,因此 RTX 4070 SUPER 的記憶體子系統性能會比 RTX 4070 更高、與 RTX 4070 Ti 看齊。雖然 RTX 4070 SUPER 相較舊代 RTX 3070 擁有 256bit 為低,但換上更高速的 21Gbps GDDR6X 記憶體顆粒,速度較 RTX 3070 的 14Gbps GDDR6 高出不少,因此整體記憶體頻寬較上代 448GB/s 更高,RTX 4070 SUPER 達至 504GB/s。
NVIDIA GeForce RTX 4070 SUPER Founder Edition 採用了 6 顆 Micron D8BZC GDDR6X 顆粒編號,為 MT61K512M32KPA-21:U,每顆單顆容量為 16Gbit (2GB),總容量 12GB 繪圖記憶體容量。
Dual Slot 軸向式散熱器設計
NVIDIA GeForce RTX 4070 SUPER Founder Eidtion 沿用軸向式散熱設計,散熱器 RTX 4070 FE 完全共用,Dual Slot、雙 10 cm 風扇,由於 RTX 4070 Founder 僅輕微提升至 220W TGP,因此沒有佖必要修改設計,沿用銅底部搭配 4 支 Heatpipe 導熱管便足夠。
採用 12VHPWR / 12V2x6 供電接頭
其實早在 RTX 4070 Foundedr Edition 開始,NVIDIA 就已經使用了經過改進的 12VHPWR / 12V-2x6 接頭,相較舊有 12VHPWR 感應接腳僅向內偏移量 0.45 mm,GeForce RTX 4070 SUPER Founders Edition 使用具有向內偏移 1.7 mm 的感應接腳,更短的感應接腳可以檢測連接器是否完全插入。如果沒有完全插入,GPU 就會被限制最大功率負載,理論上應該可解決過去發生的接頭燒毀問題,然而效果仍有待觀察,產品隨附一條 PCIe 8-Pin x 2 轉 12VHPWR / 12V2x6 轉接線 (300W)。
提供了 3 組 Display Port 1.4a + DSC 及 2 組 HDMI 2.1 影像輸出埠口,兩種輸出介面皆可提供最高 4K@240Hz 或 8K@60Hz 12bit HDR 解析度輸出,支援 VESA DSC 1.2 無損壓縮顯示功能,單卡能提供最高 2 個 8K@60Hz HDR 顯示輸出,或是組合 2 組 DisplayPort 埠口提供單一 8K@120Hz HDR 輸出。
效能測試
此次測試除了有 NVIDIA 送測 GeForce RTX 4070 Ti FE 顯示卡,同時亦找來 RTX 3070 / RTX 3070 Ti / RTX 3080 / RTX 4070 / RTX 4070 Ti 作對比測試,以了解這張 NVIDIA GeForce RTX 4070 SUPER 的效能水平。
時脈方面,NVIDIA GeForce RTX 4070 SUPER FE 預設核心基礎時脈為 1,980MHz、加速時脈 2,475MHz,支援 GPU Boost 4.0 技術最高可達 2,860MHz,最高 Power Limit 預設為 220W,可在 -55% 至 +9% 作出調整,最高可調至 240W。
散熱方面,NVIDIA GeForce RTX 4070 SUPER FE 在約 24°C 的室溫環境下閒置約 30分鐘,GPU溫度維持在 36°C。接著採用 Furmark 進行 3D 負載測試,將 GPU 完全負載 30 分鐘後,溫度會提升至 68°C,相較,GPU 時脈保持在 1,605MHz,TGP 為 220W。
測試平台
- Intel Core i9-12900K CPU
- ASUS ROG Z790 Maximus APEX
- ANACOMDA DDR5-6400 CL36-38-38-68 32GB x 2 @1.35V
- Windows 11 Professional 23H2
- NVIDIA GeForce Driver 546.52 WHQL
3DMark
Fire Strike / Time Spy
3DMark Fire Strike 與 Time Spy 作為最廣泛的 DX11 / 12 性能基準測試,性能對比結果當然不可缺少,根據測試顯示 GeForce RTX 4070 SUPER 遊戲性能相較 RTX 4070 有明顯提升,追趕過了對手 RX 7800 XT,甚至有貼近 RTX 4070 Ti 水平。
3DMark Port Royal 與 Speed Way 是針對即時光線追蹤所設計的測試工具,支援 Microsoft DirectX Raytracing 技術,讓玩家測試不同顯卡對於光線追蹤的效能,RTX 4070 性能略輸 RTX 3080,RTX 4070 SUPER 則快 RTX 3080 接近 20%,成績也十分貼近 RTX 4070 Ti。
DLSS Feature Test
3DMark NVIDIA DLSS feature test 測試透過利用 Tensor Core 以深度學習方式對較低的渲染解析度的畫面進行運算,重新輸出更高解析度的畫面,令遊戲流暢度有所提升,新增全新 DLSS 3 版本,並支援全新 Frame Generation 功能,此次測試會採用 3840 x 2160 解析度,測試 DLSS OFF、DLSS 2 及 DLSS 3 的性能差異。
GeForce RTX 4070 SUPER 在 DLSS Feature Test 表現與 RTX 3090 接近,但如果遊戲支援 DLSS 3 的話,它的性能較 RTX 3090 Ti 高出約 30%。
RT Feature Test
採用 3DMark DirectX Raytracing feature test 跑分測試,由於運行於 Microsoft DXR API 的光線追蹤模式,結果顯示 NVIDIA GeForce RTX 4070 SUPER FE 取得 61.20 FPS。
測試分數對比表格
GPU | FireStrike | FireStrike Extreme | FireStrike Ultra | Time Spy | Time Spy Extreme | Port Royal | Speed Way | RT |
GeForce RTX 3070 | 33214 | 16681 | 8535 | 13687 | 6859 | 8219 | 3501 | 32.18 |
GeForce RTX 3070 Ti | 35012 | 17824 | 9163 | 14342 | 7241 | 8726 | 3680 | 33.28 |
GeForce RTX 3080 | 41872 | 20716 | 10717 | 17159 | 8671 | 11188 | 4589 | 44.16 |
Radeon RX 7700 XT | 42511 | 21006 | 10624 | 17014 | 7843 | 9033 | 3166 | 30.04 |
GeForce RTX 4070 | 45014 | 21844 | 10149 | 17896 | 8591 | 11195 | 4475 | 51.71 |
Radeon RX 7800 XT | 51249 | 24857 | 12884 | 19996 | 9416 | 10736 | 3941 | 33.38 |
GeForce RTX 4070 SUPER | 52890 | 25620 | 12422 | 21352 | 10130 | 13162 | 5254 | 61.2 |
GeForce RTX 4070 Ti | 55214 | 27842 | 13581 | 22829 | 10946 | 14188 | 5435 | 66.69 |
GPU | DLSS Off | DLSS2 | DLSS3 |
GeForce RTX 3070 | 15.61 | 42.62 |
|
GeForce RTX 3070 Ti | 16.66 | 44.74 |
|
GeForce RTX 3080 | 22.01 | 55.64 |
|
GeForce RTX 3080 Ti | 26.37 | 65.51 |
|
GeForce RTX 3090 | 28.45 | 69.85 |
|
GeForce RTX 3090 Ti | 32.88 | 81.16 |
|
GeForce RTX 4070 | 23.09 | 58.57 | 95.09 |
GeForce RTX 4070 SUPER | 27.84 | 74.57 | 123.36 |
GeForce RTX 4070 Ti | 29.75 | 79.14 | 134.88 |
遊戲效能測試
以下的遊戲測試除非另外標註,全部皆以 2560 x 1440 解析度全螢幕執行,畫質皆設定為最高,若遊戲支援光線追蹤技術,則同時將光追畫質全開。而 DLSS 方面則統一使用 Performance 設定,當中 GeForce RTX 40 系列會啟用 DLSS 3 中新增的 Frame Generation 技術。
A Plague Tale : Requiem 瘟疫傳說:安魂曲 (RT + DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 41 | 59 |
GeForce RTX 3070 Ti | 43 | 63 |
GeForce RTX 3080 | 53 | 85 |
GeForce RTX 4070 | 54 | 112 |
GeForce RTX 4070 SUPER | 71 | 139 |
GeForce RTX 4070 Ti | 76 | 149 |
Control (RT + DLSS2)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 56 | 100 |
GeForce RTX 3070 Ti | 61 | 109 |
GeForce RTX 3080 | 80 | 137 |
GeForce RTX 4070 | 75 | 131 |
GeForce RTX 4070 SUPER | 83 | 149 |
GeForce RTX 4070 Ti | 89 | 158 |
CyberPunk 2077 RT Ultra (RT+ DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 29 | 54 |
GeForce RTX 3070 Ti | 33 | 59 |
GeForce RTX 3080 | 41 | 70 |
GeForce RTX 4070 | 43 | 104 |
GeForce RTX 4070 SUPER | 58 | 131 |
GeForce RTX 4070 Ti | 61 | 136 |
F1 22 (RT + DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 63 | 96 |
GeForce RTX 3070 Ti | 67 | 104 |
GeForce RTX 3080 | 89 | 120 |
GeForce RTX 4070 | 86 | 161 |
GeForce RTX 4070 SUPER | 95 | 184 |
GeForce RTX 4070 Ti | 101 | 196 |
Forza Horizon 5 (DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 78 | 101 |
GeForce RTX 3070 Ti | 82 | 105 |
GeForce RTX 3080 | 117 | 151 |
GeForce RTX 4070 | 119 | 173 |
GeForce RTX 4070 SUPER | 141 | 189 |
GeForce RTX 4070 Ti | 148 | 201 |
Tom Clancy's Rainbow Six Siege 虹彩六號:圍攻行動
GPU | 1080p | 2K | 4K |
GeForce RTX 3070 | 420 | 327 | 188 |
GeForce RTX 3070 Ti | 431 | 342 | 196 |
GeForce RTX 3080 | 473 | 390 | 242 |
GeForce RTX 4070 | 493 | 387 | 228 |
GeForce RTX 4070 SUPER | 571 | 482 | 279 |
GeForce RTX 4070 Ti | 585 | 513 | 312 |
Microsoft Flight Simulator 微軟模擬飛行 (DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 46 | 66 |
GeForce RTX 3070 Ti | 48 | 71 |
GeForce RTX 3080 | 63 | 97 |
GeForce RTX 4070 | 68 | 139 |
GeForce RTX 4070 SUPER | 72 | 151 |
GeForce RTX 4070 Ti | 76 | 163 |
Watch Dogs Legion (RT + DLSS)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 64 | 96 |
GeForce RTX 3070 Ti | 68 | 101 |
GeForce RTX 3080 | 76 | 127 |
GeForce RTX 4070 | 73 | 121 |
GeForce RTX 4070 SUPER | 93 | 132 |
GeForce RTX 4070 Ti | 101 | 139 |
總結
如果說 RTX 4070 SUPER 是大升級,倒不如說這才是 RTX 4070 應該有的樣貌,核心運算單元增加了約 20%,性能獲得了非常明顯的提升,終於回到昔日 70 新卡能以下犯上吊打 80 舊卡的局面,甚至有能力追貼 RTX 3090,表現令人滿意。
從價錢來說,RTX 4070 SUPER 就是拿 RTX 4070 價錢 (US$ 599) 買到接近 RTX 4070 Ti 的性能 (US$ 799),先前買了 RTX 4070 / RTX 4070 Ti 應該會牙癢癢很想罵髒話吧,只能說早買早享受、晚買享折扣囉!
以上內容及測試資料為 HKEPC 獨家授權給 UNIKO's Hardware 編譯
延伸閱讀