一項關(guān)于芯片設(shè)計的研究試圖解決圍繞谷歌人工智能工具的激烈分歧。
一項研究試圖解決圍繞谷歌人工智能工具的激烈分歧。
芯片設(shè)計大會上的討論很少白熱化。不過,一年前,在國際物理設(shè)計研討會(ISPD)上,事態(tài)失控了。觀察人員用“火車碰撞”和“埋伏偷襲”來比喻當時的事態(tài)。沖突的癥結(jié)是芯片設(shè)計難題,即谷歌借助人工智能(AI)的解決方案是否真的比人工和最先進的算法好。為此,一位知名的男性電子設(shè)計自動化(EDA)專家與谷歌的兩名年輕女性計算機科學(xué)家針鋒相對,由此引發(fā)的爭論已經(jīng)導(dǎo)致一名谷歌研究員被解雇。
2023年,同樣是在國際物理設(shè)計研討會上,該領(lǐng)域的領(lǐng)導(dǎo)者、IEEE會士安德魯?卡恩(Andrew Kahng)希望一勞永逸地結(jié)束這場爭論。他和加州大學(xué)圣地亞哥分校(UCSD)的同事對谷歌的強化學(xué)習(xí)方法進行了“公開透明的操作和評估”。他們使用了谷歌名為“循環(huán)訓(xùn)練”(Circuit Training)的開源版本,并對卡恩團隊不夠清晰的部分進行了逆向工程,他們將強化學(xué)習(xí)與人類設(shè)計師、商業(yè)軟件和最先進的學(xué)術(shù)算法進行了對比。
循環(huán)訓(xùn)練(左上)是谷歌開發(fā)的一種強化學(xué)習(xí)方法,該方法與其他各種人工智能和人工方法相互競爭,尋求在芯片上取得最好的大塊電路布局。
在大多數(shù)情況下,循環(huán)訓(xùn)練并不是贏家,但它具有競爭性。由于各種原因,該研究沒有測試循環(huán)訓(xùn)練的招牌功能:順利獲得學(xué)習(xí)其他芯片設(shè)計來提高其性能。
“ ■十大网投正规信誉官网■十大网投靠谱平台 的目標很明確,就是有助于社區(qū)不斷進步?!彼?023年國際物理設(shè)計研討會上告訴工程師們。只有時間能證明這是否可行。
谷歌的強化學(xué)習(xí)系統(tǒng)將大型電路塊(稱為宏)布局視為一種游戲。代理一次在芯片畫布上放置一個電路塊。然后,一個單獨的算法填充名為標準單元的小部件。系統(tǒng)會根據(jù)幾項指標給布局評分,并將該評分作為反饋來改進代理。
如何與何時
工程師討論的問題被稱為布局,即確定邏輯或內(nèi)存塊應(yīng)該放在芯片的什么位置。布局時必須考慮權(quán)衡各種矛盾的因素,最大限度地提高芯片的工作頻率,同時最大限度地降低其功耗和占用空間。找到這個問題的最佳解決方案是最困難的部分之一,可能的排列組合比圍棋還多。
不過,圍棋最終被一款名為深度強化學(xué)習(xí)的人工智能打敗了,這正是前谷歌大腦研究員阿扎利亞?米爾霍西尼(Azalia Mirhoseini)和安娜?戈爾迪(Anna Goldie)在布局問題上應(yīng)用的方案。該方案當時被稱為Morpheus,它將放置大塊電路(稱為“宏”)視為一個游戲,學(xué)習(xí)如何在游戲的過程中找到最佳解決方案。(宏的位置對芯片特性有巨大的影響。在循環(huán)訓(xùn)練和Morpheus中,用一種被稱為標準單元單獨的算法在空白處來填充小部件。針對宏和標準單元,其他方法使用同樣的過程。)
簡而言之,其工作原理如下:芯片的設(shè)計文件從網(wǎng)表開始,在網(wǎng)表中指定哪些宏和單元根據(jù)什么約束條件連接到其他宏和單元。為了幫助加快訓(xùn)練過程,標準單元隨后被收集到該集群。之后,循環(huán)訓(xùn)練會開始將宏一次一個地放置到芯片“畫布”上。當最后一個宏放置后,單獨的算法在空白處填充標準單元,系統(tǒng)會嘗試進行快速評估,包括布線的長度(越長越差)、密集程度(越密集越差)及其擁擠程度(越擁擠越差)。這被稱為代理成本,就像電子游戲中的分數(shù)一樣。該分數(shù)作為反饋,用于調(diào)整神經(jīng)網(wǎng)絡(luò),然后系統(tǒng)會再次嘗試。洗滌、漂洗、重復(fù)。系統(tǒng)最終學(xué)會任務(wù),商業(yè)軟件對整個布局進行全面的評估,生成芯片設(shè)計者關(guān)心的各種指標,如面積、功耗和約束頻率等。
經(jīng)過7個月的審核過程,米爾霍西尼和戈爾迪于2021年6月在美國《自然》雜志上發(fā)表了Morpheus的研究結(jié)果和方法。(卡恩是第三位審查員。)該技術(shù)用于設(shè)計多代谷歌的張量處理單元(TPU)人工智能加速器芯片。2022年1月,谷歌在GitHub上發(fā)布了循環(huán)訓(xùn)練的開源版本,但卡恩和其他人表示,即使是這個版本也不夠完整,無法復(fù)制該項研究。
為了回應(yīng)《自然》雜志上發(fā)表的內(nèi)容,一個主要由谷歌內(nèi)部工程師組成的獨立團隊開始研究自己的方法,并認為該方法可以更好地將強化學(xué)習(xí)與現(xiàn)有算法進行對比。不過,這種競爭并不友好。據(jù)新聞報道,該小組的領(lǐng)導(dǎo)人、谷歌研究員薩特拉吉特?查特吉(Satrajit Chatterjee)多次暗中損害米爾霍西尼和戈爾迪的個人利益,并于2022年因此被解雇。
查特吉仍在谷歌就職時,他的團隊發(fā)表了一篇題為《更強大的基線》(Stronger Baselines)的論文,批評了發(fā)表在《自然》雜志上的研究。他試圖將論文提交給一個大會,但經(jīng)過獨立決議委員會審查后,谷歌拒絕了。在他被解雇后,就在2022年國際物理設(shè)計研討會之前,該論文的早期版本被一個匿名推特賬戶泄露,從而引發(fā)了公眾的對峙。
基準、基線和再現(xiàn)性
《科技縱覽》在2022年國際物理設(shè)計研討會之后與電子設(shè)計自動化專家探討時發(fā)現(xiàn),批評者有3個相互關(guān)聯(lián)的關(guān)注點:基準、基線和再現(xiàn)性。
基準是公開可用的電路設(shè)計,研究人員可以在基準上測試新的算法。谷歌在開始工作時常用的基準來源于已經(jīng)有大約20年歷史的設(shè)計。盡管其與現(xiàn)代芯片的相關(guān)性存在一些爭論,但它們?nèi)匀坏玫搅藦V泛的支持。
《自然》雜志的論文主要關(guān)注的不是這些基準,而是谷歌張量處理單元的布局,這是一種復(fù)雜且前沿的芯片,該公司以外的研究人員無法設(shè)計。
基線是與新系統(tǒng)競爭的最先進的算法。《自然》雜志上的那篇論文將強化學(xué)習(xí)比作人類專家和當時領(lǐng)先的學(xué)術(shù)算法RePlAce。《更強大的基線》一文則認為,《自然》雜志的工作并未恰當?shù)貓?zhí)行RePlAce,而另一種算法模擬退火也需要進行比較。
而實際上,卡恩真正關(guān)注的是再現(xiàn)性。他認為,發(fā)布在GitHub上的循環(huán)訓(xùn)練無法讓另外一個獨立小組完全重復(fù)全過程。因此加州大學(xué)圣地亞哥分校團隊對卡恩認為缺失的元素和參數(shù)進行了逆向工程。
重要的是,卡恩的團隊公開記錄了進展、代碼、數(shù)據(jù)集和過程,作為此類工作可提高再現(xiàn)性的示例。
加州大學(xué)圣地亞哥分校的工作被稱為MacroPlacement,它不是對《自然》雜志論文的一對一的重做。除了使用公共基準,其中兩個已在2020年和2021年無法使用,MacroPlacement還分別將循環(huán)訓(xùn)練與Cadence的商業(yè)工具Innovus并發(fā)宏放置器(CMP)和英偉達開發(fā)的一種名為AutoDMP的方法進行對比,后者是在卡恩發(fā)言前幾分鐘在2023年國際物理設(shè)計研討會上公開推出的。
另一個關(guān)鍵區(qū)別在于,每個Macro-Placement結(jié)果都來自以前從未見過設(shè)計的神經(jīng)網(wǎng)絡(luò)。而在《自然》雜志論文的實驗中,研究人員曾用20個張量處理單元電路樣本對該網(wǎng)絡(luò)進行了預(yù)訓(xùn)練,然后將其結(jié)果與其他方法的結(jié)果進行比較。米爾霍西尼和戈爾迪認為缺少預(yù)訓(xùn)練剝奪了該方法的主要優(yōu)勢。她們在一封電子郵件中寫道,循環(huán)訓(xùn)練“與其他任何方法都不同,它能夠從經(jīng)驗中學(xué)習(xí),針對其看到的每一個問題,快速產(chǎn)生更好的布局”。
按照MacroPlacement常見問題解答(FAQ),沒有測試預(yù)訓(xùn)練是因為使用預(yù)訓(xùn)練網(wǎng)絡(luò)的代碼沒有在循環(huán)訓(xùn)練中發(fā)布,而且沒有可用的設(shè)計能與《自然》雜志論文中完成的訓(xùn)練相匹配。此外,對于該團隊測試的最小基準Ariane,谷歌已經(jīng)表明,預(yù)訓(xùn)練的結(jié)果不會產(chǎn)生比《自然》雜志上已發(fā)表內(nèi)容更好。
循環(huán)訓(xùn)練與其他技術(shù)的比較
卡恩的論文報告使用兩種工藝技術(shù),實現(xiàn)3種基準設(shè)計的結(jié)果。該團隊測量的指標與米爾霍西尼和戈爾迪在其《自然》雜志論文中所做的指標相同,包括面積、布線長度、功率、兩個時序指標和前文所述的代理成本。(代理成本并不是生產(chǎn)中使用的實際指標,包含該指標是為了對應(yīng)《自然》雜志論文。)結(jié)果是好壞參半。
正如《自然》雜志原始論文中所述,在大多數(shù)面對面比較的指標上,強化學(xué)習(xí)打敗了RePlAce。(對3種設(shè)計中最大的一種,RePlAce未能生成布局。)與人類專家相比,循環(huán)訓(xùn)練經(jīng)常失??;與模擬退火相比,結(jié)果多為平局。
循環(huán)訓(xùn)練(谷歌的開源強化學(xué)習(xí)布局工具)與布局算法(RePIAce、模擬退火和AutoDMP)商業(yè)軟件工具(CMP)以及人類專家的對比結(jié)果。測試采用兩種工藝實現(xiàn)3種設(shè)計(此處僅顯示NG45)。請注意,對于最大的設(shè)計Mem-Pool,AutoDMP沒有給予結(jié)果。
最大的贏家是商業(yè)工具CMP和新加入的AutoDMP,與其他方法相比,它們能在更多情況下給予最佳指標。
繼續(xù)前行
毫無疑問,這場爭端帶來的后果大多數(shù)都是負面的。查特吉陷入了與谷歌不當終止合同的訴訟。卡恩及其團隊花費了大量的時間和精力來重建幾年前完成的工作,而且可能是多次重建。多年來,戈爾迪和米爾霍西尼在承受引用未發(fā)表和未審查研究的批評后,離開了這一歷來難以吸引女性人才的工程領(lǐng)域。從2022年8月以來,她們不斷在人工智能研究公司Anthropic從事有關(guān)大型語言模型的強化學(xué)習(xí)工作。
如果說有持續(xù)的一面,那么就是卡恩的工作為開源和可重現(xiàn)研究給予了一個模型,并增加了公開可用工具,從而有助于了芯片設(shè)計中的這一部分向前開展。盡管如此,機器學(xué)習(xí)在芯片設(shè)計中的應(yīng)用已經(jīng)開始傳播開來,如今,它正在幫助了新思科技(Synopsys)和楷登電子(Cadence)的商業(yè)電子設(shè)計自動化工具在不斷開展。
然而,沒有這些不愉快,所有的好事也會出現(xiàn)。