最近 DER8AUER (ROMAN) 去到美國拜訪 INTEL,拍了幾支影片介紹 INTEL 內部運作。其中一支名為 Intel Engineer on : Die Thinning, CPU Thermals and Liquid Metal 的影片講述 DER8AUER 訪問了一位 INTEL 的工程師 MARK GALLINA,了解 INTEL 是如何決定 CPU DIE 的高度。由於內容過於艱深,以下內容或許有錯,以影片內容為準。
INTEL 工程師揭開 CPU DIE 高度設計的秘密
MARK GALLINA 是一位 SENIOR THERMAL ANALYST,職位是 SENIOR THERMAL AND MECHANICAL ARCHITECT,他負責研究 CPU 的熱量如何傳遞和控制,範圍包括散熱設計、氣流影響等等。DER8AUER 的第一個問題是 INTEL 根據什麼因素來決定 CPU DIE 的高度。
為此 INTEL 工程師先解構整個 CPU 的組成部份,由底部起分別是 SUBSTRATE (CPU 的 PCB),然後用以固定 CPU DIE 的 DIE ATTACH 部份 (類似 BGA),之後便是主角 CPU DIE 晶片。CPU DIE 的熱量由第一層導熱介面 (SOLDER TIM) 傳遞至 IHS 頂蓋,然後再由第二層導熱介面 (散熱膏) 將熱量傳至 CPU 散熱器。
CPU DIE 內的核心 (CORE) 分佈在 DIE 的底部,核心是發熱源頭。
熱傳導由溫差驅使,意思是熱量會向溫度較低的方向發散。
熱阻 THERMAL RESISTANCE (R) 包含熱傳導的距離 (L)、CORE 的表面積 (A)、導熱系數 (K)。
MARK GALLINA 在這部份的工作主要是平衡熱傳導的距離 (L),定出最理想的 DIE 高度。當 DIE 的高度變得較小時,垂直的熱傳導距離便會縮短,使熱阻下降,提升 CPU 散熱效果。但如果 DIE 的高度太小,便會限制垂直方向以外的熱傳導距離,最終影響 CPU 散熱。INTEL 指出經過研究後發現如果少於 ~0.2 mm,熱阻反而會上升。
DER8AUER 指出目前的 INTEL CPU DIE (ALDER LAKE / RAPTOR LAKE) 約高 0.6 mm;AMD RYZEN 約在 0.8 mm;INTEL 的 IVY BRIDGE 約在 0.4 mm。而 INTEL 進一步解釋最終的 CPU DIE 高度除了單純從熱阻的方向決定外,亦需要考慮其他因素,特別是生產上的困難。CPU 的產量目標、生產時間、原材料準備等等都是 INTEL 首要考慮的局限條件,CPU DIE 高度決定反而是最後一步。
這些困難包括製造 CPU 的生產設備的能力、準備 CPU 生產設備所需的時間等等,更重要的是要確保在整個生產過程中 CPU DIE 不受損壞而且符合相關標準。這些 CPU 溫度以外的局限條件一同決定最終最理想的 CPU DIE 高度,簡單來說就是不能做得太薄,因為要確保 CPU DIE 安全和可靠,可見 INTEL 非常重視 CPU 的壽命和品質。INTEL 目前每日產出數十萬顆 CPU,所以 CPU 整個的生命 / 生產周期都要一併考慮,要評估這些生產設備能否在一段長時間內在維持一定產出量,同時做到不損壞 CPU DIE。
DER8AUER 提到 INTEL 由 i9-9900K 開始改回使用 SOLDER TIM 作為 CPU DIE 與 IHS 之間的熱傳導介面。如果考慮上到上述的生產過程和難度,便能了解 INTEL 工程師在決定改用 SOLDER TIM 時所需估算和考慮的範圍有多大。 INTEL 難以在同一時間更改至 SOLDER TIM 同時再進一步削減 CPU DIE 高度而不考慮生產難度。
INTEL 工程師表示如果一次性改動太多 CPU 內的設計,勢必將增加生產風險。每一個微小的 CPU 設計改變,INTEL 都要確認這些改變能夠撐過整個 CPU 的生命 / 生產周期,當中涉及極大量的資料收集和驗證,更要趕在 CPU 出貨前 (INTEL RTS, READY TO SHIP) 決定好。這些現實條件迫使 INTEL 工程師要在短時間內作出決定,所以 INTEL 每次 (每一代) 只能改一點點設計,其後所得出的資料分析結果可能要到下下代產品才能用得上。
INTEL 提到光是更改至 SOLDER TIM 背後可能已經涉及數年的研發和驗證,關於使用者的使用環境,亦是 INTEL 要考慮的因素之一。溫差、負載程度、電壓、功耗等等,這些變化周期和次數會影響 CPU 的可靠性和壽命,INTEL 依靠一些科學推算模擬這些變化,從中決定合適的設計。當 INTEL 提供 3 年保固,意味 INTEL 相當有信心該 CPU 能夠撐過 3 年使用。近代 INTEL CPU 的 TJMAX 大多都是 100°C,INTEL 在 CPU 內加入了溫度限制保護機制,防止當導熱媒介如 SOLDER TIM 出現破裂導致 CPU 損壞。
影片後半部份還有討論到 SOLDER TIM 的厚度和探討手動磨 DIE 後再使用液態金屬會否影響 CPU DIE 等等,筆者就不一一介紹。與其說 CPU DIE 的高度是如何決定,倒不如由 CPU 的生產角度了解 CPU 的製作過程有多困難。筆者終於明白 CPU 溫度在 CPU 有效生產和可靠性面前可謂不值一提,自然不是 INTEL 的首要考慮因素。每日數以萬計 CPU 出產,又有多少流入 DIY 超頻玩家手上天天跑 PRIME 95?真是令人慚愧和感到渺小。
至於有什麼比 INTEL CPU 製造更厲害?那就不得不提到那一位在 82 歲高齡創造中國龍芯 CPU 的中國一代宗師黃令儀了,太厲害了!筆者認為世人不應該稱她為老婆婆 / 女宗師,應該像 Tár 一樣擺脫世俗的性別定型。 總而之言,這些體態良好正值壯年的 INTEL 工程師們可能都要跪下來了!