INTEL 正式發佈新一代處理器 ARROW LAKE-S。RAPTOR LAKE-S REFRESH 的 CORE I9 14TH 成為 CORE I 系列的最後一代,新一代正名為 CORE ULTRA。實際上 ARROW LAKE 在 CORE ULTRA 系列屬第二代,第一代是 METEROR LAKE 的 CORE ULTRA 100,只是 METEOR LAKE 未有推出主流桌上型處理器。 ARROW LAKE 既然屬於 CORE ULTRA 系列,也意味內部設計將採用類似 METEROR LAKE 與 LUNAR LAKE 的做法,AGGREGATION。INTEL 終於把多 TILE 設計放到主流平台,以下筆者整理一些由 INTEL 官方提供關於 ARROW LAKE-S 與 Z890 晶片組的重點。
ARROW LAKE-S 著重功耗與溫度表現
首先,ARROW LAKE-S 可看作 LUNAR LAKE 的完整版,只是 LUNAR LAKE 為低功耗筆電市場而生,ARROW LAKE-S 也沒有 ON CHIP 的外部 DDR5 顆粒。多 TILE 設計由 METEOR LAKE 開始,分為 COMPUTE TILE / SOC TILE / GRAPHICS TILE / BASE TILE 等等,有別於以往 CORE I 系列的一整顆 DIE 放在 PCB SUBSTRATE 的做法。
INTEL 表示 ARROW LAKE-S 與上代 RAPTOR LAKE-S REFRESH 的 CORE I9-14900K 相比,可帶來最高 30 % 的功耗改善、超過 10% 的多執行緒性能,以及至少 2 倍的圖像運算性能。
補充一點,ARROW LAKE-S 的 S 代表桌上型 CPU,ARROW LAKE HX 的 HX 則是筆電型 CPU,前者採用 LGA 1851 封裝。本文只針對 ARROW LAKE-S 作介紹。
ARROW LAKE-S 的設計目標很清晰,首要目標就是壓低功耗,改善 PERFORMANCE PER WATT 每瓦性能,然後加入 NPU 神經處理器提供 AI 運算,構成 AI PC,最後是提供豐富的擴展性以及操控性,當中包括超頻。
在主流桌上型處理器上加入 NPU 是 INTEL 首次實現,以往的 RAPTOR LAKE-S 13/14TH 都沒有。此外 INTEL 為了增強 ARROW LAKE-S 整體的 AI TOPS,在圖像運算上也加入新一代 Xe 核心,引進 ARC 架構,貢獻了不少 TOPS。
補充一點,INTEL 官方 PPT 所展示的 CPU 圖片,很多時候都是反過來的。留意 CPU 的三角形,實際安裝在 Z890 主機板時該三角形應該位於左下方。如圖所示,晶元的部份左下那一塊就是 COMPUTE TILE (P/E CORE),實際上應該是右上才對。
所謂 AGGREGATION,也可以看為多 DIE 設計,但 INTEL 把 DIE 往中央靠,有別於 AMD 把 I/O DIE 與 CPU DIE 完整分離的做法。
INTEL 表示 ARROW LAKE-S 整合 WIFI 6E、THUNDERBOLT 4、PCIE GEN5 等擴展性。WIFI 6E 在主機板上應該還是需要無線網路模組,但 THUNDERBOLT 4 據了解還真的是原生直出的方案,不再需要用到 JHL8540 等外部的雷電控制器。原生 THUNDERBOLT 也是 INTEL 首次引進到主流桌上型處理器。
運算上,新的 Xe 核心作為圖像處理、新的 MEDIA ENGINE 和 DISPLAY ENGINE 負責影像編碼和解碼處理以及輸出影像、NPU 則負責 AI 指令集的處理、由 LUNAR LAKE 先行引入的新一代 P-CORE (LION COVE) 與新一代 E-CORE (SKYMONT)、還有新一代的 DDR5 支援等等。所以 ARROW LAKE-S 將擁有 INTEL 這幾年所設計的最新東西,一次端上。
INTEL 的多 TILE 設計由自家 FOVEROS 3D PACKAGING 工藝包辦,ARROW LAKE-S 也有 4 大 TILE,分別是 GPU TILE、SOC TILE、COMPUTE TILE 以及 I/O TILE,比 AMD 的二分法 (COMPUTE DIE 與 I/O DIE ) 更細緻。FILLER TILE 還真的用作 FILL IN THE BLANK 填補空缺。值得一提的是 INTEL 的 AGGREGATION 一直都有 BASE TILE 這一部份,承載表面各個 TILE。
AGGREGATION 分了那麼多 TILE,其實就是為了把各個區塊劃分開來,以便日後更換整顆 TILE,又不必重新設計整個 DIE。從 LUNAR LAKE 的設計來看,只保留 COMPUTE TILE,然後重構 COMPUTE TILE 內部的組成部份,再用一顆 PLATFORM CONTROLLER TILE 便搞定了,便足以取代什麼 SOC TILE 與 I/O TILE。這也意味什麼 TILE,TILE 裡有什麼,TILE 之間的組合,也是 AGGREGATION 的一部份,隨 INTEL 喜歡隨便弄都可以按設計目標和市場需求定制,有點 CPU 化整為零的概念。
以筆電版的 ARROW LAKE-HX 來說,因為市場不一樣,主機板和機殼不一樣,INTEL 也可以按不同的需要,壓一下整體的 CPU 封裝面積 (PCB)。
據了解,INTEL ARROW LAKE-S 與 RAPTOR LAKE-S (R) 在整體大小上 (PCB PACKAGE),是差不多的。不過因為 INTEL 有改掉 PCB SUBSTRATE 那個 NOTCH 凹槽的位置,對應的插座的卡榫位置 (ALIGNMENT KEY) 也有改掉,你也不要隨便亂放。另一方面,從板廠的 Z890 實物來看,ARROW LAKE-S CPU 的三角形 (TRIANGLE PIN ONE MARKING),與上代一樣都在左下方。INTEL 官方 PPT 的 CPU 圖片要反過來看才對。
ARROW LAKE-S 的 COMPUTE TILE 包含 P-CORE 與 E-CORE,數量組合上沒有改變,仍然是最大 8P + 16E 的設計。如果把官方圖片反過來,也就是 CPU 整體的熱點 (P-CORE) 的確往右上偏移。INTEL 表示 ARROW LAKE-S 的 P-CORE (LION COVE) 的 IPC 比上代設計 (RAPTOR LAKE-S REFRESH 的 RAPTOR COVE) 強 9%,不過因為出廠頻率上 ARROW LAKE-S 有變得更保守,實際最終出廠的單核性能改變未必是 9%。
新一代 P-CORE 架構 LION COVE 側重於改善每瓦單核性能,以及改善 P-CORE 佔用面積所帶來的性能,難怪 INTEL 仍然堅持 8P 的設計。
新一代 E-CORE 架構是 SKYMONT,提升之大可從 LUNAR LAKE 上看到。ARROW LAKE-S 的 E-CORE 大幅改善多執行緒性能,盡量覆蓋更多運算以確保 E-CORE 得以善用,來維持高效率表現,壓低功耗。官方比較顯示,ARROW LAKE-S 的 E-CORE 在單執行緒性能上,比上代的 GRACEMONT (14TH) 隨隨便便強了 30 ~ 70%。INTEL 的架構改進目標是大幅提升 E-CORE 多核性能,以此作為補充 P-CORE 數量不多的有效手段,再提升 P-CORE 的單核性能,來壓功耗同時保持性能,也就是每瓦性能大提升。
關於 CACHE 的部份,與 14TH 比較,ARROW LAKE-S 將各顆 P-CORE 增加了 1MB L2$ 至 3MB。此外 ARROW LAKE-S 還把 L3$ 改為共享設計,名為 SHARED INTEL SMART CACHE,目前 P-CORE 與 E-CORE 共用相等容量的 L3$ 也就是 36MB。在 14TH 上,L3$ 不是整合且共享的設計,而是分拆為 16 組 L3$,每一組 3MB L3$ 獨立分派給每一顆 P-CORE 與 4 組 E-CORE CLUSTER (共 16 顆 E-CORE)。
ARROW LAKE-S 也引進新一代 INTEL THREAD DIRECTOR,屬硬體設計,旨在為 OS 作業系統提供 CPU 內部運作情況和性能 / 效率估算等底層資訊,協助 OS 指派核心處理運算。新的 E-CORE 因為無比強大,也理應能處理更多運算,發揮效率。INTEL THREAD DIRECTOR 會先提示 OS 使用 E-CORE,當需要更強大性能時才會協助指派 P-CORE。這邊也再沒有 HYPER THREADING 超執行緒,意味 P-CORE 就是 P-CORE 本身。
其他還有改進 ARROW LAKE-S 效率的設計,也包括供電設計 DLVR、頻率調整步進更細緻 (16.6 MHz 而非 100 MHz) 等等。
超頻一直是 INTEL 的強項,INTEL 沒有因為上代的問題而砍掉超頻。因應多 TILE 設計,INTEL 既提供 CPU BCLK 負責 P-CORE 與 E-CORE,還有全新的 SOC BCLK 負責 SOC TILE,難怪在 COMPUTEX 上看到主流 Z890 都配備外部時脈產生器晶片 (EXTERNAL CLOCK GEN)。各 TILE 之間的傳輸,INTEL 也容許超頻,意味各 FABRIC 也有專屬的電壓和頻率。DLVR 屬內部供電設計,INTEL 更容許在 (極限) 超頻時改用外部供電,意味這一代的超頻向主機板變得更實在。
關於 GPU 圖像運算處理的部份,ARROW LAKE-S 沒有如對手一樣只視為開機用,而是為了遊戲 / 運算而生,也是 AI TOPS 的主要貢獻來源。新一代 Xe 核心架構再增強,與 14TH IGPU 相比實現兩倍提升,也提供了最大 8 TOPS。
由 INTEL 提供的圖表來看,對於 CPU 處理器來說,末來將更吃重 NPU 和 GPU 的部份。這次 ARROW LAKE-S 的 SOC TILE 佔據那麼大的面積,也是 NPU 所在地,看來 INTEL 未來或許沒打算增加 P-CORE 數量了。
ARROW LAKE-S 的 36 TOPS 由 GPU 提供 8 TOPS、NPU 提供 13 TOPS 和 CPU 提供 15 TOPS,三者各負責不同的指令集。
AI 的部份筆者不懂,反正第 3 代 NPU 就是厲害,無論 AI 影片、音樂、遊戲和直播都能用到。
關於 SOC TILE,還有 MEDIA ENGINE 與 DISPLAY ENGINE,前者提供編碼和解碼,支援最大 8K60Hz 串流和共享;後者負責輸出影像,最大支援 4 組 4K60Hz HDR,或支援一組 8K60Hz HDR。此外,仍然是 4 DDI 設計,HDMI DP 都有。INTEL 甚至提到高 Hz 的原生支援,例如 1080P 360Hz 以及 1440P 360Hz。
ARROW LAKE-S 的記憶控制器只支援 DDR5,並被安排在 SOC TILE 裡。ARROW LAKE-S 將支援原生 6400 MHz,也包含 CUDIMM 這種加入 CKD 晶片的 UDIMM。
關於 PCI-E 通道和 THUNDERBOLT 4 雙輸出,主要集中在 I/O TILE (圖中右下),也有一部份 PCI-E 通道位於 SOC TILE 內。
800 系列晶片組也準備好了,Z890 將提供 24 組 PCI-E 4.0 通道,另有 8 組 PCI-E 4.0 通道用作連接 CPU 作為上行通道。總平台的 48 組 PCI-E 可用通道,扣除晶片組的最大 24 組後還剩 24 組,意味 CPU 也有 24 組。請注意晶片組 24 組 PCI-E 通道中,已包含 8 個原生 SATA,原生 SATA 屬複用通道而非獨立提供。至於 32X USB 3.2 筆者看不懂,只知道應該還是 10 組 HSIO,最大提供 10 個 10 Gbps USB,或換成 5 個 20 Gbps,又或是降為 10 個 5 Gbps USB 都可以,總之不是 5 + 10 + 10 共 25 個 5 Gbps 或以上的 USB。
THUNDERBOLT 4 40 Gbps 現已整合至 CPU 的 I/O TILE,不佔用任何 PCI-E 通道,也不需要外部控制器,只需要中繼器。而 WIFI 6E、LAN 等等,相信還是需要額外模組與控制器來實現。
網路軟體方面 INTEL 提供 INTEL KILLER 軟體,若使用 KILLER LAN 和 WIFI,更支援聚合功能。此外也增設 WIFI 訊號評分和頻寬分配等 AI 功能。
總結以上,ARROW LAKE-S 具備 30% 功耗下降、10% 多核運算性能提升、2 倍圖像處理能力、36 TOPS AI 性能。也許性能並未大幅成長,但在每瓦性能上 INTEL 終於交出能夠與對手一戰的設計。
請問這份簡報有辦法在 Intel 官網上找到嗎?感謝。
https://www.intel.com/content/www/us/en/newsroom/news/core-ultra-200s-series-desktop.html#gs.gl4n6d