異構集成(chéng)趨勢下，如何解決暗矽效應？-蘇州飛邁電子科技有限公司

異構集成(chéng)趨勢下，如何解決暗矽效應？

發(fā)布時(shí)間：2022-04-25

浏覽次數：36 次

文︱ED SPERLING

來源︱Semiconductor Engineering

編譯 | 編輯部

芯片制造商開(kāi)始重新審視異構系統中應該使用多少暗矽，在哪裡(lǐ)工作得最好(hǎo)，以及有哪些替代方案可用——這(zhè)是摩爾定律擴展放緩以及SoC日益分解的直接後(hòu)果。

暗矽的概念已經(jīng)存在了幾十年，但随著(zhe)物聯網的引入，所有東西都(dōu)必須安裝在單個芯片上，并使用小電池工作，暗矽才真正開(kāi)始發(fā)展起(qǐ)來。事(shì)實證明，對(duì)于智能(néng)手表和手機的初始版本來說，這(zhè)種(zhǒng)做法是存疑的。而當時(shí)最好(hǎo)的解決方案是關閉任何基本應用不需要的電路。

然而，其他問題接踵而至。例如，當設備重新通電時(shí)，浪湧電流（特别是那些需要更快打開(kāi)的設備）會(huì)給電路帶來壓力，從而導緻芯片損壞。因此，雖然關閉芯片的某些部件的電源可以減少老化，但快速打開(kāi)它們也可能(néng)引發(fā)問題。在過(guò)去十年中，通過(guò)低功耗芯片的工程設計，其中大部分問題已經(jīng)得到解決，并且暗矽加上極其高效的設計，推動了下一代移動設備的發(fā)展，同時(shí)也對(duì)極大縮減了數據中心的能(néng)源成(chéng)本。

現在的問題是，除了延長(cháng)兩(liǎng)次充電之間的時(shí)間之外，還(hái)能(néng)做些什麼(me)，而僅僅添加更多的暗矽并不能(néng)解決這(zhè)個問題。相反，人們更加關注滿足應用需求的芯片設計，而這(zhè)得益于從設計到制造流程的一系列開(kāi)發(fā)。其中：

整個生态系統一直在圍繞先進(jìn)封裝發(fā)展和高效設計工具，OSAT和代工廠提供了經(jīng)過(guò)矽驗證的分立元件（如Chiplet）以及各種(zhǒng)封裝方法。這(zhè)使得芯片制造商能(néng)夠開(kāi)發(fā)更複雜的器件，同時(shí)還(hái)可以更有效地爲特定領域應用進(jìn)行分區和優先排序。

先進(jìn)的封裝爲更短的信号路徑和更快的互連開(kāi)辟了道(dào)路。與大型平面(miàn)芯片相比，信号在封裝中的傳播距離可能(néng)更短，并且這(zhè)些信号可以通過(guò)利用先進(jìn)的互連和新材料，從而在驅動時(shí)實現更快速、功耗更低的數據傳輸。

超低功耗設計和各種(zhǒng)功能(néng)（例如接近阈值計算）在很大程度上仍處于觀望狀态，然而目前卻正在受到更廣泛的關注。此外，在過(guò)去十年中，電池内部的密度以每年平均5%至6%的速度增長(cháng)，使設備能(néng)夠使用相同尺寸甚至更小的電池做更多的事(shì)情。雖然終端設備的外形尺寸往往相對(duì)一緻，但可以在不影響電池壽命的情況下將(jiāng)更多設備封裝在設備内部。

所有這(zhè)些變化都(dōu)是日積月累的。因此，與其關閉芯片的大部分電源，不如使用較小的芯片或Chiplet來完成(chéng)更多工作，這(zhè)可以更具成(chéng)本和能(néng)效。此外，芯片中的各種(zhǒng)功能(néng)可以在最佳工藝節點上開(kāi)發(fā)，權衡成(chéng)本、用例、靜态電流洩漏和尺寸等因素。

“還(hái)有更多各種(zhǒng)各樣(yàng)的解決方案，”Arm的研發(fā)研究員Rob Aitken表示。“暗矽背後(hòu)的部分想法是有一個固定的功率預算，特别是對(duì)于移動計算。但是，如果縮小設備，同時(shí)提高頻率，那麼(me)功率就(jiù)不會(huì)真正改善。相反，最終會(huì)得到這(zhè)個空白空間，并且有各種(zhǒng)各樣(yàng)的想法來解決這(zhè)個問題。

對(duì)于智能(néng)手機和可穿戴設備來說，暗矽是一種(zhǒng)經(jīng)過(guò)驗證的解決方案，但它不是最有效的解決方案。還(hái)有其他選擇，從限制各種(zhǒng)組件尺寸到將(jiāng)它們分散在封裝中，從而在增加密度時(shí)減少熱效應。這(zhè)對(duì)于内存尤其有價值，因爲内存在較低溫度下可以更有效地運行。因此，當附近的電路斷電時(shí)，内存可能(néng)會(huì)保持冷卻，但浪湧電流會(huì)很快使其過(guò)熱。更好(hǎo)的選擇是將(jiāng)内存與先進(jìn)封裝中的主動邏輯物理分離。

“如果溫度太接近最大允許的工作範圍，你可能(néng)不得不更頻繁地刷新内存，”Rambus的傑出發(fā)明家Steven Woo指出。“當内存器件過(guò)熱時(shí)，最終可能(néng)會(huì)失效。如果器件溫度升高，那就(jiù)不得不做所謂的節流。注意縮短以最佳性能(néng)運行的時(shí)間，或者在短時(shí)間内運行，讓其再次冷卻下來。”

所有這(zhè)些技術以及其他發(fā)展使移動設備能(néng)夠進(jìn)行比過(guò)去更密集的計算，而不會(huì)耗盡。“在移動領域，功率實際上升了，”Arm的Aitken認爲。“與15年前相比，如今的芯片消耗了更多的功率。由于電池技術的發(fā)展，以及更多的物理區域，可以讓器件更有效地散熱，從而提高了芯片功率。”

通過(guò)三維層級規劃隔離芯片的各個部分，并采用各種(zhǒng)技術，如動态電壓頻率調節，以及一些暗矽，可以更有效地進(jìn)行熱管理。它也可以使用更少的矽面(miàn)積來完成(chéng)，這(zhè)提高了性能(néng)，并爲相同器件中的其他功能(néng)和特性打開(kāi)了大門。

這(zhè)種(zhǒng)方法還(hái)有其他好(hǎo)處。“過(guò)去有理由選擇越來越大的芯片，這(zhè)樣(yàng)你就(jiù)可以將(jiāng)更多的功能(néng)集成(chéng)到單個芯片中，”Fraunhofer IIS自适應系統部門工程設計方法負責人Roland Jancke表示。“如果你不需要矽的某些部分，那麼(me)你可以關閉它們以節省電力。但是還(hái)有其他原因使用較小的芯片。例如，相較于數字電路，如果在設計中包含模拟電路，則通常位于成(chéng)熟工藝節點中，因此它會(huì)占用更多區域（這(zhè)使得減小數字元件的尺寸更具優勢）。而對(duì)于RF而言，則需要大量的功率。Chiplet也有安全優勢，很難複制整體系統功能(néng)，僅在以相同方式將(jiāng)相同部分集成(chéng)到相同封裝中時(shí)，它才有效。如果你使用這(zhè)些芯片中的任何一個都(dōu)失敗了，那麼(me)你就(jiù)錯過(guò)了整體功能(néng)。

人工智能(néng)的影響

重新思考關閉部件以及關閉時(shí)間的驅動因素之一涉及人工智能(néng)和機器學(xué)習，其中芯片設計旨在實現最大的性能(néng)和吞吐量。對(duì)于需要非常快速地處理大量數據的大型數據中心尤其如此。通常，這(zhè)涉及并行工作的強大處理器内核，其中一些内核是專門爲這(zhè)些數據中心工作負載設計的，通常與GPU、CPU、某種(zhǒng)類型的NPU和DSP結合使用。問題是這(zhè)些設備依賴于穩定的數據流，并且該數據流并不總是一緻地流動。

“如果有兩(liǎng)種(zhǒng)解決方案，其中一種(zhǒng)解決方案更有效地使用晶體管，那麼(me)每美元和每瓦特將(jiāng)獲得更多的吞吐量，”Flex Logix首席執行官Geoff Tate指出。“因此，從客戶的角度來看，采用暗矽是不可取的。很難開(kāi)發(fā)出高利用率的架構，但利用率越高越好(hǎo)。

在過(guò)去的五年裡(lǐ)，随著(zhe)人工智能(néng)變得越來越普遍，人們對(duì)什麼(me)是最佳方案的看法改變了。“在人工智能(néng)的早期階段，第一個挑戰就(jiù)是讓一些功能(néng)發(fā)揮作用并改進(jìn)模型，使它們越來越好(hǎo)，并沿著(zhe)學(xué)習曲線上升，” Tate指出。“在數據中心領域，其擁有巨大的預算和巨額利潤，這(zhè)使他們能(néng)夠做一些以前無法做到的事(shì)情。但是，當我們尋求將(jiāng)AI部署到大批量應用，且對(duì)價格更敏感的解決方案中時(shí)，客戶將(jiāng)尋找能(néng)夠爲其功率預算和金錢預算提供最大的推理性能(néng)的供應商，我們看到的大多數企業在達到他們的資金預算之前就(jiù)達到了功率預算。這(zhè)不僅僅是出于成(chéng)本原因而有效地使用晶體管。擁有的晶體管越多，洩漏就(jiù)越多。因此，如果你能(néng)用更少的晶體管完成(chéng)工作，它將(jiāng)更加節能(néng)。”

在人工智能(néng)世界中，“暗矽”也可以具有另一種(zhǒng)含義。“盡管供應商試圖提供所有芯片和所有馬力，但當你試圖運行實際的神經(jīng)網絡模型時(shí)，甚至無法獲得接近40%的系統，”AMD數據中心人工智能(néng)和計算市場高級總監Nick Ni表示。“引擎可以非常快，但如果你沒(méi)有要處理的數據，那麼(me)它們就(jiù)閑置了。這(zhè)就(jiù)是導緻暗矽的原因。”

圖 1：AMD 的 3D V-Cache 使用堆疊在處理器上的緩存小芯片（圖源：AMD）

挑戰在于徹底了解需要處理的上下文和數據量，然後(hòu)圍繞這(zhè)些因素設計芯片。AMD收購Xilinx的原因之一，以及英特爾收購Altera的原因之一，是能(néng)夠微調其中一些設備的使用方式。可編程邏輯可以根據需要動态重新配置和調整大小，因此可以根據需要使用小型FPGA，而不是巨型FPGA。雖然巨型FPGA的效率永遠不如硬連線ASIC，但較小的可編程邏輯芯片可用于減少未充分利用或未利用的矽的數量。

“雖然能(néng)夠爲每個市場構建定制ASIC會(huì)很好(hǎo)，但其中一些用例是如此多樣(yàng)化，以至于市場變得越來越小，而構建ASIC的成(chéng)本正在上升，”Rambus的Woo表示。“因此，FPGA與x86結合使用是有意義的。您可以加載位文件以用于特定于市場的工作，然後(hòu)利用 x86 的通用基礎結構來完成(chéng)其他所有操作。”

Chiplet架構的影響

Chiplet增加了另一個級别的靈活性，因爲芯片尺寸可以根據特定功能(néng)所需的任何條件進(jìn)行調整。這(zhè)意味著(zhe)可以完全消除芯片中未使用的部分，而不是將(jiāng)其置于睡眠狀态，并且可以將(jiāng)附加功能(néng)放在不同的小芯片上。

“芯片尺寸是采用Chiplet的主要驅動力之一，”TechSearch總裁Jan Vardaman在最近的一次演講中說。“如今，GPU和CPU的芯片尺寸非常大，我們确實必須擁有更多的晶體管。隻是我們必須弄清楚如何經(jīng)濟地將(jiāng)所有這(zhè)些晶體管放在一起(qǐ)并發(fā)揮作用。因此，我們在推動Chiplet采用方面(miàn)所做的額外工作將(jiāng)使我們能(néng)夠制作出更高密度的更精細的封裝。您可以做一些提高電源效率的事(shì)情，這(zhè)在我們的許多應用中都(dōu)非常重要。”

關鍵是能(néng)夠以最有效的方式將(jiāng)各個部分組合在一起(qǐ)。“我們必須能(néng)夠以一種(zhǒng)新的方式思考設計。這(zhè)是一個系統架構，“Vardaman表示。“因爲你得到的是一個更小的模具，這(zhè)可以提高産量，所以你將(jiāng)使用最先進(jìn)的節點來制造需要這(zhè)些節點的零件。您不會(huì)在高性能(néng)邏輯節點中制造芯片的模拟部分。您將(jiāng)在其他節點中將(jiāng)其鑄造，因爲它更便宜。你要把所有這(zhè)些放在一起(qǐ)。小芯片是硬 IP 塊。它必須共同優化。所有這(zhè)些東西都(dōu)可以一起(qǐ)工作。你不能(néng)孤立地設計這(zhè)些東西。”

在這(zhè)種(zhǒng)情況下，暗矽隻是降低功耗的另一種(zhǒng)選擇，而不一定是最好(hǎo)的選擇。雖然它可以爲特定功能(néng)提供儲備計算能(néng)力，但它不是設計複雜系統的最有效方法。

總結

將(jiāng)更多功能(néng)封裝到芯片上的能(néng)力不斷削弱，但功耗和性能(néng)優勢也在不斷縮小。因此，芯片制造商正在尋求通過(guò)先進(jìn)封裝來繼續降低功耗、提升性能(néng)。但在封裝中，暗矽并不如單個高性能(néng)芯片那麼(me)有吸引力，後(hòu)者的尺寸更具普适性，并且數量在十億芯片範圍内。即使在最理想的條件下，暗矽似乎也顯示出它的年齡。

“我們正處于這(zhè)種(zhǒng)暗矽軌迹中，”Aitken稱。“有一堆東西進(jìn)入了暗矽思維過(guò)程，這(zhè)些東西已經(jīng)逐漸成(chéng)爲主流。您將(jiāng)構建一個具有許多不同核心功能(néng)的芯片。但是，如何始終打開(kāi)所有功能(néng)以最大化提高計算性能(néng)仍然是一個非常困難的問題。這(zhè)是你可能(néng)不想回答的問題，因爲它會(huì)産生大量的熱量，無論如何你都(dōu)無法處理。”