5種工藝1000億晶體管 Intel造出有史以來最復(fù)雜的芯片?
從歷史上看,英特爾將其積累的所有芯片知識用于推進(jìn)摩爾定律,并將這些知識應(yīng)用到其未來的 CPU 中。如今,其中一些高級處理器將用于阿貢國家實驗室即將推出的“Aurora”超級計算機(jī)。
然而,要求苛刻的模擬和建模工作負(fù)載也能從 GPU 加速中獲益匪淺。認(rèn)識到這一不斷增長的需求,英特爾著手設(shè)計和構(gòu)建迄今為止最復(fù)雜的 GPU,并在非常緊迫的時間內(nèi)完成。
這項努力的結(jié)果是,以前代號為“Ponte Vecchio”的英特爾 Max 系列 GPU將 1000 億個晶體管和 47 個區(qū)塊打包到五個工藝節(jié)點(diǎn)上。
除此之外,它們還包括兩項封裝創(chuàng)新,即 EMIB 2.5D 和 Foveros 3D 技術(shù),以及將模塊堆疊在一起以獲得更高的處理器密度。
英特爾 Max 系列 GPU 產(chǎn)品經(jīng)理 Duke Tallam 表示:“英特爾 Max 系列 GPU 的開發(fā)周期非常緊湊,因此將其變?yōu)楝F(xiàn)實就像挑戰(zhàn)我們的團(tuán)隊一年蓋房子,明年建造摩天大樓?!?/p>
“迄今為止,GPU 是我們最復(fù)雜的處理器,代表了英特爾硅產(chǎn)品的巨大飛躍。然而,整個封裝可以放在一個人的手掌中。”
眾多創(chuàng)新將 MAX 系列 GPU 推向市場
Max 系列 GPU 的巨大復(fù)雜性需要全球英特爾團(tuán)隊成員的支持。在俄勒岡州和亞利桑那州的工廠完成技術(shù)開發(fā)過程后,硅片被運(yùn)往英特爾在檳城的制造工廠進(jìn)行大批量生產(chǎn)。
不過,要達(dá)到那個階段,需要創(chuàng)造性的解決方案,因為英特爾需要對其制造過程進(jìn)行多次修改。首先,英特爾將芯片晶圓互連的間距縮小到 36μm,大約是人類頭發(fā)的寬度。
這是 Intel 晶圓廠或工廠成功使用過的最細(xì)粒度的pitch。
英特爾工廠還開發(fā)了一種在工廠生產(chǎn)線上測試裸片的新方法——稱為單一堆疊裸片測試 (SSDT)。SSDT 確保在添加其他昂貴的組件(如基板 和高帶寬內(nèi)存 (HBM) 芯片)之前,只有功能正常的芯片才能在制造過程中向前推進(jìn) 。
該公司還找到了一種將管芯焊接到封裝上的新方法,將工藝能力提高了 50%。最后,該小組開發(fā)了先進(jìn)的晶圓級組裝工藝,將可靠性提高了十倍。
除了 GPU 的技術(shù)復(fù)雜性之外,驗證過程還涉及在最少數(shù)量的樣本 GPU 上完成硅前測試的挑戰(zhàn)。
因此,該團(tuán)隊不再依賴物理樣本進(jìn)行測試,而是轉(zhuǎn)向虛擬模擬來展示虛擬芯片在真實場景中的表現(xiàn)。在其他地方,工程師采用其他創(chuàng)造性方法來加速測試過程,例如在從事該項目的許多團(tuán)隊成員之間運(yùn)行并行工作流的方法。
當(dāng)被問及在兩年內(nèi)將 GPU 推向市場所需的巨大努力時,英特爾的 Tallam 提出了他的觀點(diǎn)。
“我們在制造處理器方面擁有半個多世紀(jì)的經(jīng)驗,但設(shè)計 GPU 的復(fù)雜性和性能要求需要我們過去的所有知識和技能?!?/p>
Tallam 繼續(xù)說道,“Max 系列 GPU 有助于彌合當(dāng)今已經(jīng)令人難以置信的 HPC 系統(tǒng)與世界上少數(shù)能夠或?qū)⒁_(dá)到 exascale 級性能的系統(tǒng)之間的差距。
因此,我們以意大利佛羅倫薩著名的橋梁命名 GPU 似乎是正確的。
Max 系列 GPU 橋既美觀又功能非凡。我們的團(tuán)隊對更小規(guī)模的 GPU 也有同樣的看法?!?/p>
這些數(shù)據(jù)中心 GPU 與新推出的 Intel Xeon CPU Max 系列處理器的綜合能力將加速工作負(fù)載,從而在比以前更短的時間內(nèi)揭示有價值的結(jié)果。阿貢國家實驗室是 Max 系列的首批采用者之一。
其團(tuán)隊計劃部署 60,000 個 Max 系列 GPU,平均分配給 10,000 個服務(wù)器刀片。
每個刀片還將依靠兩個 Intel Xeon CPU Max 系列處理器(這些是帶有 HBM 內(nèi)存的“Sapphire Rapids”Xeons SP)來最大化 Aurora 的架構(gòu),以應(yīng)對一些有史以來最重要的科學(xué)工作負(fù)載。
一旦 ANL 在其旗艦 Aurora 系統(tǒng)上部署完整的 Max 系列 GPU 和 CPU,其雙精度計算性能將超過 2 exaFLOPS。
研究人員已經(jīng)計劃將所有計算能力用于一些最具挑戰(zhàn)性的科學(xué)問題,例如宇宙建模、推進(jìn)基于聚變的安全能源解決方案、幫助實現(xiàn)醫(yī)學(xué)突破或更精確地預(yù)測颶風(fēng)。
這些 GPU 代表了英特爾雄心勃勃的多年IDM 2.0 產(chǎn)品領(lǐng)導(dǎo)、創(chuàng)新和長期客戶價值戰(zhàn)略的核心組成部分。
匯集一切
去年 11 月,馬來西亞的檳城組裝與測試 (PGAT) 員工慶祝了首批 60,000 個 GPU 的制造。馬來西亞擁有英特爾最大的組裝和測試制造工廠,由四家工廠組成。

檳城組裝與測試 (PGAT) 工廠經(jīng)理 Wong Mei Fong 在她 28 年的英特爾職業(yè)生涯中經(jīng)歷了很多挑戰(zhàn)。盡管如此,與 GPU 的 1,500 名團(tuán)隊成員的復(fù)雜性和協(xié)調(diào)性相比,它們都相形見絀。
PGAT 需要用通常與這種規(guī)模的項目相關(guān)的一半時間來滿足生產(chǎn)需求。為了使這一切成為可能,其他團(tuán)隊和工廠也支持這項工作。
“該產(chǎn)品的眾多復(fù)雜性是無與倫比的。由于時間緊迫,我們面臨的嚴(yán)峻挑戰(zhàn)變得更加困難,”Mei Fong 說。“盡管存在這些障礙,我們在合作伙伴組織的寶貴幫助下實現(xiàn)了最初看似不可能的目標(biāo)?!?/p>
寶貴的教訓(xùn)
從開發(fā)和制造 GPU Max 系列中獲得的綜合經(jīng)驗為未來的生產(chǎn)流程帶來了新的見解,這將加速即將推出的處理器的交付。Tallum 指出,“我們對最新的處理器版本感到興奮,我們很自豪有機(jī)會為實現(xiàn)突破性科學(xué)盡自己的一份力量。”

責(zé)任編輯:憲瑞
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

