AI 這個名詞絕對是今年與未來最火熱的議題之一,目前出現各類生成式 AI 應用,例如 ChatGPT 和 Stable Diffusion,為產業帶來全新的發展路線。為了讓生成式 AI 應用有更高效的產出,AMD、Intel 與 NVIDIA 等晶片廠商皆不斷研發新的軟硬體,以期在這塊市場上取得更多收益。這次筆者就利用目前持有的三張入門顯示卡 (ARC A380、GTX 1650 和 RX 6400),來讓讀者了解三家晶片廠商的入門產品能提供多少運算效能。
GUNNIR ARC A380 Photon 6G OC 外觀
筆者這張 ARC A380 品牌是 GUNNIR,是一張需要外接電源的版本,目前台灣電商平台有銷售的 SPARKLE ARC A380 ELF 則無需外接電源。兩者主要差別是 GPU 加速頻率。據 TechPowerUp 資料庫顯示,ARC A380 Photon 6G OC 加速頻率是 2450 MHz,ARC A380 ELF 加速頻率是 2050 MHz,差了 400 MHz。
ARC A380 Photon 6G OC 外盒正面印有產品外觀彩圖,散熱器跟外接電源的設計,讓它看起來不像入門級顯示卡。右上角標示該卡為 Intel ARC 3 系列成員,支援 XeSS 超採樣技術和 DirectX 12 Ultimate API。
背面標示該卡需要的環境配備,例如 350W 以上並且有 8 Pin PCIe 電源接頭的電源供應器、建議 8GB 以上系統記憶體、AMD Ryzen 3000 系列及更新的處理器並能開啟 Resizable BAR 功能的平台,以及 Windows 10 或 Windows 11 64 位元系統。
正面可以看到整體採黑色雙風扇散熱器,背面也有一塊黑色的金屬強化背板,已經是接近中階顯示卡才有的待遇,整體尺寸不含擋板為 222 x 114 x 42 mm。
內部可以看到有一塊不小的鋁擠散熱片,還有一根導熱管。上方印有 Intel ARC 字樣,8 Pin 電源插座旁還有一塊 GUNNIR Logo 的發光區域,正常開機時會發藍光。
在影像輸出方面,具備 1 個 HDMI 2.0 跟 3 個 DisplayPort 2.0 輸出接頭,是新台幣 4000 左右顯示卡中輸出接頭最多的。
性能測試
硬體規格
處理器 | AMD Ryzen 5 5600X (關閉 PBO) |
---|---|
主機板 | ASUS PRIME B550M-K/CSM |
記憶體 | XPG SPECTRIX D60G DDR4 RGB 3000 8GB x2 (OC 3200) |
顯示卡 | ASUS Dual Radeon RX 6400 GUNNIR ARC A380 Photon 6G OC ZOTAC GAMING GeForce GTX 1650 Low Profile |
儲存 | ADATA Legend 710 |
螢幕 | TUF Gaming VG27AQL1A ZAKU II EDITION |
驅動版本:
- ASUS Dual Radeon RX 6400 - AMD Software : Adrenalin Edition 23.11.1
- GUNNIR ARC A380 Photon 6G OC - Intel Arc & Iris Xe Graphics 31.0.101.4972
- ZOTAC GAMING GeForce GTX 1650 Low Profile - GeForce Game Ready 546.17
作業系統:Windows 11 23H2 (關閉防毒)
電源設定:平衡模式
性能與遊戲測試
3DMark
不免俗的還是要跑一下 Benchmark,首先是 3DMark,Time Spy 中 ARC A380 分數最高,Fire Strike Extreme 中則是 RX 6400 表現最佳。
Geekbench
再來是 Geekbench,OpenCL 性能 GTX 1650 具備優勢,Vulkan 則是 RX 6400 領先,而 ARC A380 在這兩項測試中性能皆居次。
GravityMark Vulkan
GravityMark Vulkan 的顯示卡性能排名與 Geekbench Vulkan 相同,表示 RX 6400 在 Vulkan API 的效能表現是三者中最強的,只是大家性能差距也不大。
Counter-Strike 2
簡單試個遊戲,首先是 Counter-Strike 2,由於是入門顯示卡,所以筆者統一使用 1080P 120Hz 低特效全螢幕設定,地圖選 Dust 2 進行 AI 對戰,結果 RX 6400 出現畫面異常不能玩,只有在未設定全螢幕前的視窗化狀態下正常,因此 RX 6400 在這項沒有成績。GTX 1650 在 CS2 遊戲測試中 AVG FPS 最高。
Overwatch 2
接著測 Overwatch 2,一樣是 1080P 120Hz 低特效全螢幕,關閉動態渲染比率,遊戲解析度設定 100%,最大幀率 300,地圖 66 號公路,AVG FPS 由 RX 6400 勝出。
AI 相關應用測試
Stable Diffusion WebUI
現在進入重頭戲,先來試個最常用的本地 AI 應用 Stable Diffusion WebUI,模型使用 Stable Diffusion V1.5,GTX 1650 用的是 AUTOMATIC1111 的 Stable Diffusion web UI,版本 1.6.0;ARC A380 用的是 openvinotoolkit 的 Stable Diffusion web UI,版本 1.6.0;RX 6400 使用 Nod.AI 專為 AMD RDNA 顯示卡最佳化的 Shark (Vulkan API),版本 20231009.984。測試使用的設定和 Prompt 跟「Stable Diffusion AI 生圖加速新利器!透過 LCM LoRA 大幅提升生圖速度」這篇相同,測試結果顯示 Intel 的 OpenVINO 加速相當出色,速度讓對手看不到車尾燈。
本地 LLM 大型語言模型運作效能測試
筆者使用 KoboldCpp V1.5 載入 Taiwan-LLM-7B-v2.1-chat-Q4_K_S.gguf 模型進行測試,設定只更改 Presets,GTX 1650 選擇 cuBLAS,ARC A380 和 RX 6400 選擇 CLBlast,詢問的問題是「什麼是LLM」,連續三次。圖片排序左至右依序是 GTX 1650、ARC A380、RX 6400,測試結果顯示 GTX 1650 效率最高,RX 6400 次之。
AI 影片放大補幀效能測試
測試工具使用 Waifu2x-Extension-GUI 版本 3.108.01, 放大工具選擇 Real-CUGAN ncnn Vulkan,放大倍率為預設的 2X,補幀工具選擇 RIFE ncnn Vulkan,針對各顯示卡開啟硬體加速選項,圖片儲存格式用 WebP,圖片品質設 80,測試的影片來源 (360P) 可按此下載。此項測試由 GTX 1650 拿下冠軍,RX 6400 獲得亞軍。
結論
以一般娛樂用途而言,在新台幣 4000 這個價位上,三款顯示卡的效能其實差不多,要是真的想跑 AI 應用,那麼 NVIDIA 的顯示卡絕對是目前最穩的選擇,AI 相關應用軟體基本上都支援 CUDA,可以讓你獲得下載即可用的體驗。
在本次測試結果中,AMD 顯示卡雖然性能表現不如 NVIDIA (這邊僅考慮 Windows 平台) ,透過 OpenCL 或 Vulkan API 還是可以獲得一定程度的效果。另外,AMD 的 ROCm 雖然說已登陸 Windows 平台,但筆者使用 KoboldCpp 的 ROCm 版本只能正常開啟程式,載入模型後就自己關閉了,而 Shark 從 Vulkan 改為 ROCm 會顯示錯誤出不了圖,因筆者手上沒 AMD 更高階的顯示卡 (本身偏好用無須外接電源的顯示卡),不曉得是不是 VRAM 不夠所以跑不了,或是有其他原因,也希望能在 Windows 系統上看到更多最佳化解決方案出現。
至於 Intel ARC 顯示卡在 AI 的發展,只要 Intel 持續積極對社群 / 開發者進行資源投入,以本次 Stable Diffusion WebUI 測出來的效率來看,在 Windows 系統的未來令人期待。
筆者並非 AI 相關產業人員,對這方面並不熟悉,若是大家有更準確且方便比較性能的測試方法 / 工具歡迎提出,希望是以簡單安裝、容易使用且免費或開放原始碼,能夠在 Windows 系統正常運作為主。關於 AI 應用測試結果僅供參考,測試期間為 11 月底至 12 月初,有機會且剛好有硬體的話會繼續測試一些東西給大家看。
喜歡我們的文章歡迎分享,別忘了追蹤 UH 粉絲專頁並設為最愛,或是每天到 UH 網站逛逛,才不會錯過各種軟硬體資訊喔!
延伸閱讀
Stable Diffusion AI 生圖加速新利器!透過 LCM LoRA 大幅提升生圖速度
NMKD Stable Diffusion GUI – AMD 與 NVIDIA 顯示卡都能用的 AI 繪圖工具包
提升 AMD Radeon 顯示卡 Stable Diffusion 圖片生成速度的秘密武器 – Microsoft Olive