AMD 最新推出的 Ryzen Threadripper Pro 7000 WX 系列,以其獨特之處脫穎而出,主要彰顯於全新的「Zen 4」核心架構、改進的系統單晶片設計,以及業界領先的效能與效率,架構資訊請參考以下介紹。
Threadripper Pro 7000 WX 架構分析
AMD Ryzen Threadripper Pro 7000 WX 技術升級,突顯了多項關鍵技術升級,其中包括分支預測改進、擴充的大型操作記憶體、增大的指令退出佇列、擴充的整數 / 浮點暫存器文件、進一步擴充的核心緩衝區、強化浮點單元內的 AVX-512 支援、以及載入 / 儲存效能改進。此外 L2 快取也進一步升級至 1M 並擴展至 8-way,這些升級將為使用者提供更卓越的運算效能與處理效率。
AMD Ryzen Threadripper Pro 7000 WX 針對快取層次結構進行了重要最佳化,以提升處理效能。新系列搭載快速的私有 1MB L2 快取,每個核心從 L2 到 L3 支援更多突出的未命中情況,並在從 L3 到記憶體的情況下提供更多未命中的支援。
這些最佳化基於「Zen 3」架構,其中 L3 快取在複合體中的所有 8 個核心之間共享,並由 L2 快取填充,L2 標籤也在 L3 中複製,用於探針過濾和快速快取傳輸。這樣的設計確保了更高效的快取系統,為使用者提供更優秀的處理性能。
AMD Zen 4 架構 IPC 提升 13%:22 個工作負載的綜合表現分析,最新一代 Zen 4 架構呈現令人亮眼的世代間指令每週期 (IPC) 改良,經測試顯示 IPC 提升達 13%。此測試以 22 種工作負載為基礎,固定於 4GHz 頻率以及 8 核心的條件下進行。
Ryzen Threadripper Pro 7000 WX 強化了 AVX-512 指令集,呈現多項卓越升級。
AVX-512 指令強化:
- 新增了每頻道屏蔽功能,加強選擇性操作的能力。
- 引入新的分散 / 聚集指令,提升資料操作的靈活性。
- 透過 256b 操作,實現區域高效率的實施。
- 與 AVX-256 相比,吞吐量相當,但指令取得與控制開銷減少,效率更高,預計使用 AVX-512 指令將獲得更優異的頻率。
BFloat16 指令支援:
- 強化了 VNNI 指令支援,進一步最佳化了相關演算法的效能。
- 這些 AVX-512 指令的升級將為使用者帶來更強大、高效的處理能力,特別是在需要大規模資料運算的場景下。
Threadripper 7000 系列在計算能力方面重要的升級
快取結構:
- 每核心搭載 1MB L2 快取,並可擴展至每 CCD (Core Complex Die) 達 32MB 的 L3 快取。
ISA 更新:
- 新增 BFLOAT16、VNNI、AVX-512 指令 (256b 資料通道),擴充了指令集架構。
記憶體可達性:
- 支援 57 位虛擬地址與 52 位實體地址,擴展了記憶體位址的可達範圍。
架構更新:
- 最新的 IOD (I/O Die) 和內部 AMD Gen3 Infinity Fabric 架構升級,提高了核心間的晶片間連接頻寬。
目標 TDP 範圍:
- 設定了高達 350W 的目標 TDP 範圍,確保了系列產品的穩定運作。
更新的 RAS (Reliability, Availability, and Serviceability):
- 強化了可靠性、可用性和可服務性,進一步保障系統的穩定運作。
Threadripper 7000 系列強大的記憶體性能升級
記憶體通道與頻率:
- 提供 8 條通道的 DDR5 記憶體支援,搭配 ECC 功能,最高達 5200 MHz 的頻率。
記憶體通道插槽選擇:
- 提供 2、4、6、8 條通道的記憶體交互選擇,根據需求選擇適當的記憶體配置。
記憶體型式:
- 支援 RDIMM (Registered DIMM),確保記憶體的可靠性。
單通道最大容量:
- 每條通道最高可達 1 個 DIMM,總容量可擴展至每通道 2TB,為大規模運算和多任務處理提供了充足的記憶體資源。
Threadripper 7000 系列搭載 sTR5 平台 帶來了多項升級特點
全新插槽及強化的電源供應和 VR 技術:
- 採用全新 sTR5 插槽,提供更強大的電源供應和 VR (Voltage Regulator) 技術,確保系列產品穩定高效的運作。
Gen3 AMD Infinity Fabric:
- 支援 Gen3 AMD Infinity Fabric 技術,通信速率高達 32Gbps,提供更快速的資料傳輸和更高效的系統性能。
控制樞紐 (Controller Hub):
- 強化的控制樞紐搭載多種埠口,包括 USB、UART、SPI、I2C 等,為系統提供了更豐富的外部連接和擴展選擇,提高了系統的靈活性和可擴展性。
Threadripper 7000 系列更強大的整合 I/O 功能升級
PCIe Gen5 128 條 IO 資料通道:
- 支援高達 128 條 PCIe Gen5 IO 資料通道,提供極速資料傳輸,速度達 32Gbps,並支援至最小 x1 的分流模式。
SATA 最多 32 條 IO 資料通道:
- 提供高達 32 條 IO 資料通道,專為 SATA 設備設計,滿足儲存需求。
Threadripper 7000 系列大幅加強安全功能
專用安全子系統:
- 引入專用安全子系統,為系列產品提供更加完善的安全保護。
安全引導 (Secure Boot):
- 支援安全引導技術,確保系統啟動過程的安全性,防止惡意軟體入侵。
硬體信任根 (Hardware Root-of-Trust):
- 強化了硬體信任根功能,確保系統的整體安全,防止惡意攻擊。
SME (Secure Memory Encryption):
- 支援 SME (Secure Memory Encryption) 技術,加密記憶體中的敏感資料,進一步保護系統的安全性。
AES-256-XTS 加密:
- 提供強大的 AES-256-XTS 加密,加強對資料的保護,確保資料儲存和傳輸的安全性。
Ryzen Threadripper Pro 7000 系列具有卓越的記憶體功能升級
記憶體通道與頻率:
- 支援 8 通道 DDR5 記憶體,最高達 DDR-5200 的速度,確保卓越的記憶體性能。
理論峰值記憶體頻寬:
- 理論峰值記憶體頻寬高達 266GB/s(8 通道 * 8B * 5.2GTs),為高效能運算提供強大支援。
單通道最大容量:
- 每條通道最高可達 1 個 DIMM,WRX90 支援最高 2TB,TRX50 支援最高 1TB,滿足多樣化的記憶體需求。
記憶體型式與支援:
- 支援 RDIMM,確保記憶體的可靠性。
UECC 重試功能:
- 具有讀取 UECC 重試功能,進一步提高記憶體的可靠性。
高效的雙列和單列模組:
- 在雙列和單列模組上具有高頻寬和效率,最佳化 DRAM 容量和系統 TCO。
Ryzen Threadripper Pro 7000 系列在記憶體方面進行了重要升級
多通道記憶體交互選項:
- 提供 2 通道、4 通道、6 通道和 8 通道的記憶體交互選項,可根據系統需求平衡延遲和頻寬。
自訂配置以滿足系統要求:
- 針對系統需求,可以靈活調整以達到最佳的延遲和頻寬的平衡。
NPS1 預設配置:
- 預設配置為 NPS1,確保系統預設運作在最優性能下。
多記憶體節點配置 (NPS):
- 支援在單個插槽中配置多個記憶體節點 (NPS) ,以進一步最佳化系統性能。
Ryzen Threadripper Pro 7000 系列強大的 I/O 功能升級
晶片對晶片連接性能升級:
- 引入晶片對晶片連接技術,支援高達 12 個 CCD 的連接,擴展了系列產品的 I/O 能力。
升級 IOD/CCD 和封裝共同設計:
- 進一步升級 IOD (Input/Output Die)、CCD (Core Complex Die) 和封裝的共同設計,提升了 I/O 的效能和整體系統性能。
Ryzen Threadripper Pro 7000 系列改進的晶片間埠
改進的晶片間連接技術:
- 新一代晶片間連接技術,每位元 bit 消耗低於 2pJ,並透過額外的基於使用情況的功耗減少進一步提高效能。
最高 36Gbps 傳輸速度:
- 最高可達 36Gbps 的傳輸速度,以內部 FCLK (最大 1.8GHz) 為 20:1 的傳輸比例,提供更高效的晶片間通信。
高達 2 倍的探針吞吐量比 5000 系列更快:
- 與 5000 系列相比,探針吞吐量最高可提高 2 倍,進一步加速系統效能。
Ryzen Threadripper Pro 7000 系列 I/O 功能升級
PCIe Gen5 通道:
- 每個插槽擁有 8 條 PCIe Gen5 通道,總共可達 128 條通道,提供高效的數據傳輸。
額外 Gen3 通道:
- 每個插槽附加 8 條 Gen3 通道,進一步擴展了連接選項。
結合 PCIe 和 SATA SERDES:
- 支援 PCIe 和 SATA SERDES 的結合,提供多功能的連接埠。
極高 IO 連通性:
- 每條 x16 PCIe 插槽最多可支援 9 個 PCIe 設備 (例如 x8 + 8x1 配置),保證高度的 IO 連通性。
高峰值 (每個插槽) IO 頻寬:
- 與 5000 系列相比,每個插槽的高峰值 IO 頻寬提高了 90%,提供更出色的 IO 效能。
AMD Ryzen Threadripper Pro 系列和上世代對比,在性能、核心數、快取容量、I/O 效能、記憶體等方面都獲得顯著升級。
Ryzen Threadripper Pro 7995 WX 與 Intel Xeon X9-3495X 的比較
每個核心的功耗降低高達 73%:
- Ryzen Threadripper Pro 7995 WX 在功耗方面取得了顯著突破,每個核心的功耗降低高達 73%,這使得系列產品更為節能高效。
2 倍更快的渲染速度:
- Ryzen Threadripper Pro 7995 WX 在渲染速度方面表現出色,具有 2 倍更快的渲染速度,加速了專業應用的處理效率。
效能功耗比提高 2.2 倍:
- Ryzen Threadripper Pro 7995 WX 顯著提高了效能功耗比,比 Intel Xeon X9-3495X 高達 2.2 倍,展現了卓越的運算性能並保持較低的功耗水平。
使用 Threadripper PRO 進行機器學習,可以在強大的 CPU 上本地運作大型模型:
- 機器學習通常與高階 GPU 關聯。
- ML 模型需要高計算能力、高記憶體容量和頻寬。
- 桌上型 GPU 在記憶體容量方面存在限制。
- Threadripper PRO 能執行更大、更精準的模型
- 在使用 70 億參數的 Llama-2 模型時,準確度提高了高達 189%。
將於美東時間 10/19 上午 9 時進行重要公告。該公告內容將於隨後的時間點進行上架,具體上架日期為美東時間 11/21 上午 9 時。Ryzen Threadripper Pro 7995 WX 建議售價 USD 9,999、Ryzen Threadripper Pro 7985 WX USD 7,349、Ryzen Threadripper Pro 7975 WX USD 3,899、Ryzen Threadripper Pro 7965 WX USD 2,649。
而 Ryzen Threadripper 7000 系列售價為:Ryzen Threadripper 7980X USD 4,999、Ryzen Threadripper 7970X USD 2,499、Ryzen Threadripper 7960X USD 1,499。
關於 Threadripper Pro 7000 WX 系列資訊介紹,請參考「專注創意、驅動創新!AMD Threadripper PRO 7000 WX 系列強勢登場」一文。
延伸閱讀