讓數據和人工智能在EDA中發揮更大效用
電子設計自動化工具會產生海量數據,但這些數據對人工智能的實際價值幾何?行業正探尋新方法,助力人工智能發揮更佳效能。
半導體設計過程會產生海量數據,但其中有多少能被人工智能工具利用、又有多少具備實際價值?若能獲取更優質、更易訪問的數據,人工智能的工作效率又能提升多少?這些都是半導體企業和 EDA 工具廠商一直在探索的開放性問題。
已有報告顯示,將智能體人工智能(Agentic AI)應用于現有工具和數據,已取得顯著成效,能為重復性任務或優化工作構建高效的反饋循環。但要充分發揮智能體工作流的價值,行業或許需要先沉下心來解決基礎問題 —— 半導體研發流程中的數據會持續變化,而不同設計階段、不同設計項目之間的數據關聯性,目前尚未得到充分考量。
實現左移設計的前期工作已為解決這一問題奠定基礎。左移設計即利用后期流程的近似仿真結果,在設計初期做出科學決策,這一過程往往需要對數據進行抽象處理或構建降階模型(ROM),而這些工作都需要實現自動化,這也可能需要借助人工智能技術。
當下的行業數據現狀
工程師們目前正借助 EDA 工具生成的信息,順利完成芯片的設計與驗證工作。南安普頓大學人工智能與 EDA 領域研究員西蒙?戴維曼表示:“我們獲取的幾乎所有數據,我都稱之為‘以人為核心’的產物 —— 這些數據都是為工程師查看、研究而設計的。無論是日志文件還是波形圖,其語義性都十分薄弱。我們手握海量數據,卻無法通過這些數據清晰知曉其實際作用。多數工作流都將數據視為副產品,而非可調控的抓手,而數據本應成為指導設計工作的核心服務。”
大語言模型雖能讀取這類數據,但部分內容的解讀存在主觀性。Vtool 公司首席技術官奧利韋拉?斯托亞諾維奇稱:“理論上我們可以生成更多數據,但最大的機遇在于從現有數據中挖掘更大價值。我們的目標并非追求數據量,而是數據質量。智能代理能夠挖掘日志文件和波形圖的價值,更全面地呈現驗證工作的進展。優化日志記錄方式已能提升分析深度,而人工智能輔助的日志生成技術將進一步突破這一上限。行業的工作重點應是通過數據分析,將現有數據轉化為具有實際意義的設計指導。許多團隊在發現智能代理能從日志中提取大量關鍵信息后,都會主動優化自身的日志記錄體系。”
驗證等流程會產生海量日志文件和各類信息,而梳理這些信息正是人工智能的核心應用場景。IC Manage 公司首席執行官迪恩?德拉科表示:“我旗下的企業已在多個環節應用人工智能,其中調試環節的應用尤為深入。芯片設計過程中會運行大量流程,涉及眾多芯粒、芯片組件和知識產權模塊,一旦某個環節出現問題,我們能通過仿真檢測到異常,卻需要耗費大量精力排查問題根源。而人工智能在梳理海量日志、數據集和各類信息,以及定位問題方面,效率極高、表現出色。”
不過,目前仍有大量 EDA 工具生成的數據未對用戶開放。新思科技首席產品經理吉姆?舒爾茨指出:“EDA 工具會產生大量數據,但大部分都未向用戶開放,這些數據僅由工具的核心引擎用于信息交互和糾錯調整。多數用戶也并不需要這些數據,因為他們無法將其有效利用于設計優化。”
但這是否意味著行業還需要更多數據?戴維曼給出了否定答案:“我認為并非如此,我們需要做的是優化數據監測方式,讓數據以標準化的形式呈現。這是行業面臨的核心監測難題,關鍵在于實現數據的可觀測性、語義化,以及對數據的管控與治理。當下的問題是,EDA 工具生成的數據都是面向人類的‘冗余產物’,并非能被機器直接利用的有效依據,只是單純的信息輸出,工程師需要耗費大量精力去梳理分析。”
并非所有人都認同這一觀點。ChipAgents 公司首席執行官威廉?王表示:“EDA 行業一直存在一個固有認知,即工具輸出的數據是‘為人類服務的’,但事實上這一觀點早已過時。一次簡單的回歸測試就能生成數百萬行日志和海量波形文件,沒有工程師能逐字逐句看完所有內容,他們最多只能通過關鍵詞檢索、查看少量波形片段,對疑似異常的內容進行分析,其余絕大部分數據,實際上都成了機器產生的‘冗余信息’。”
EDA 數據的體量極為龐大,單次設計快照的數據量往往就能達到數太字節。新思科技資深院士比爾?馬倫稱:“數據存儲需兼顧存儲空間最小化和訪問高效性,人類可讀性不應成為首要考量,但必須保證能對數據進行提取和可視化,方便工程師理解。”
要實現實質性突破,行業必須重視對管控數據的研究。西門子 EDA 產品負責人薩蒂什庫馬爾?巴拉蘇布拉馬尼亞表示:“目前我們擁有的數據量已足夠支撐人工智能的應用,只是在數據構建方式上仍需優化,以提升其可推導性。核心問題在于如何對數據湖中的數據進行標注、如何將數據庫向量化、如何對接所有相關數據源,以及如何讓數據湖與團隊的工作需求保持同步。在構建數據湖時,我們會為每一份數據標注信號類型、標簽、來源,同時明確其適用場景、禁用場景,以及可適配的軟件版本。當我們將數據開放至數據湖時,能為其添加大量相關標注信息。”
此外,數據的覆蓋范圍也需要進一步拓展。穆爾實驗室人工智能公司創始人兼首席執行官謝莉?亨利表示:“當前的 EDA 工具并未充分利用所有可用數據,主要原因有兩點:一是支撐智能體人工智能有效運行的大部分數據,都分散在各工具專屬的數倉中,尚無標準化方式實現跨工具的數據關聯;二是這些數據大多‘被困’在人類可讀的日志、報告和工具專屬數據庫中,并非為機器解析設計的結構化數據。”
一旦解決上述問題,當下 EDA 工具生成的大量數據甚至可能不再需要。Normal Computing 公司產品工程負責人阿爾溫德?斯里尼瓦桑稱:“在原生人工智能工作流中,EDA 工具目前生成的大部分數據最終都會變得多余。這些數據中很大一部分都是中間產物,其生成的唯一目的,是讓工程師確認某個設計步驟已正確完成。但這類中間產物大多可以直接舍棄,因為它們的存在只是為最終產品服務。”
這也意味著 EDA 工作流需要做出變革。亨利補充道:“事實上,從整個 EDA 生態來看,我們能找到所有目前已知的、可利用的數據 —— 這也是各類 EDA 工具被研發出來的初衷。設計遙測模式的研發,有望將設計和工藝狀態轉化為可查詢的圖譜,并通過極簡的應用程序接口(API)實現跨工具的數據共享。未來可根據實際需求,對這一模式進行優化,以提供更多維度的數據。”
未來的 EDA 發展,需要與當下截然不同的數據體系。斯里尼瓦桑表示:“從長遠來看,芯片設計將實現從需求規格到物理設計的端到端直接落地,那么只要我們擁有能驗證設計評審結論的模型 —— 這些結論原本需要通過中間產物讓工程師確認,我們又為何需要 EDA 工具生成的中間輸出?行業真正需要思考的問題,并非‘我們生成的數據是否足夠’,而是‘我們是否為真正重要的工作流,生成了合適的數據’。”
人工智能智能代理技術
如今,多數人工智能智能代理只能讀取單個 EDA 工具生成的數據(可能包含多次運行結果),并試圖從中推導有效信息,最終可能會對設計方案或工具運行參數做出調整。Normal Computing 公司人工智能工程師金道潤表示:“工程師會根據仿真結果反復優化參數,在少量迭代后收斂至預期的性能目標,人工智能智能代理的工作模式與之相似 —— 它會持續從仿真和其他流程生成的數據中提取洞察,為后續決策提供依據,而這類工作模式的落地,需要標準化程度較高的數據支撐。”
人工智能智能代理的價值,要么是產出更優的設計結果,要么是大幅節省工程師的工作精力。巴拉蘇布拉馬尼亞稱:“在同一問題的不同版本迭代中,實現跨運行過程的知識遷移,將成為核心關鍵,其能帶來的效益也十分可觀。一旦我們構建起不犧牲精度的自驗證檢查循環,不僅能大幅節省計算資源和軟件許可證的使用時間,還能快速得到設計答案。而當智能體工作流落地后,效率還將實現數量級的提升。針對特定任務優化后的智能體工作流,能知曉設計的歷史版本,也能明確如何設計回歸測試才能實現產能最大化,并在后續的運行中直接落地這一策略。”
而識別設計中的變化,是實現這一目標的核心。威廉?王表示:“工程師真正需要的并非更多的工具輸出,而是更高層級的工作流編排:哪些故障是新出現的?哪些是無意義的噪聲?哪些流程需要重新運行?設計發生了哪些變化?芯片是否已具備流片條件?我們應將日志和波形圖視為智能控制層的遙測數據,人工智能智能代理能持續對回歸測試結果進行分類、聚類故障、挖掘根因,并驅動后續的工具運行。人類只需參與決策判斷和審批簽字,而工作流的實際運行則由智能代理完成。在當下的芯片設計規模下,這并非錦上添花的功能,而是在流片前管控設計復雜性的唯一途徑。”
EDA 工具的智能體人工智能能力正在快速演進。馬倫表示:“這類能力能充分利用所有可用數據,無論是當前設計產生的數據,還是過往同類、異類設計的運行數據,都能成為優化依據,進而提升設計結果的質量,讓優化工作能基于歷史數據進行精準調優。”
行業需要在現有能力的基礎上持續突破。亨利稱:“EDA 行業正處于人工智能發展的關鍵拐點,要延續摩爾定律核心的性能和生產效率提升趨勢,關鍵在于利用智能體人工智能補充、增強(而非替代)工程師的能力。這一切都始于重新規劃 EDA 工具的數據需求,并利用人工智能構建統一的‘設計遙測’模式,就像現代云系統對追蹤數據和指標進行標準化那樣。”
目前已有部分問題的解決,需要整合多個工具、多次運行產生的數據。斯托亞諾維奇表示:“我們將驗證工作視為大數據問題來解決,通過數據分析和建模,將海量仿真輸出轉化為清晰、可落地的洞察,讓工程師獲得前所未有的設計可視性和管控能力。故障分類的核心,是檢測通過性測試中隱藏的異常、可視化設計的行為模式,并將設計或測試平臺的變更與故障進行關聯分析。這類可視化分析,能挖掘出那些原本被隱藏的設計規律和異常點。”
人工智能能為驗證工作節省的每一分鐘,都能為行業帶來巨大增益。德拉科舉例道:“比如在設計無實質變更的仿真工作中,人工智能就能發揮巨大作用。它能基于 Verilog 設計或門級設計,高效生成虛擬或真實的測試用例,充分驗證設計的各項性能,從而大幅提升設計的測試覆蓋率。”
只要數據能在需要時被快速檢索,就無需將所有數據都進行輸出。戴維曼表示:“我們在開放硬件領域研發了 RISC-V 驗證接口(RVVI),核心目的就是打造可交互的追蹤數據。這一接口不僅定義了追蹤數據的格式,還開發了與模型交互的 API,使其成為一套數據交互的標準協議,而非單純的追蹤數據和截圖查看工具。這才是正確的發展方向。未來,我們可以將這些工具封裝為人工智能智能代理的子組件,實現更多功能。工程師可以向智能代理提出關于設計和追蹤數據的問題,而非讓其單純地復述信息。我們需要為智能代理提供真實的運行依據,而非僅有的追蹤信息,并實現數據溯源,這將徹底改變智能代理的工作模式。”
模型上下文協議(MCP)
長期以來,EDA 行業一直通過 API 調取工具的內部數據。Amiq 公司首席執行官克里斯蒂安?阿米特羅亞伊表示:“模型上下文協議(MCP)這一開放標準的推出,讓行業邁出了關鍵一步,它實現了人工智能智能代理與外部數據、應用程序的互聯互通。我們研發的 MCP 服務器,能通過這一協議,將完整的設計和驗證層級編譯數據庫中的信息,開放給人工智能智能代理,尤其是代碼生成類的智能代理。訓練數據不足、缺乏上下文信息,會導致人工智能出現幻覺現象,或生成錯誤的寄存器傳輸級(RTL)代碼、測試平臺代碼。而我們通過讓智能代理利用語言語義和項目上下文的深度知識,有效解決了這一問題,確保代碼生成的準確性。我們堅信,其他 EDA 工具也會找到利用我們數據庫中數據的新方式,而我們也將通過 MCP 協議,為行業提供更多有價值的信息。”
這一協議已在行業內獲得廣泛關注。巴拉蘇布拉馬尼亞稱:“我認為行業和客戶共同的核心需求,是打造兼容 MCP 協議的產品。MCP 服務器本質上就是人工智能領域的 API 層,只是功能更為智能。我們可為每款產品搭建專屬的 MCP 服務器,然后開放并定義所有操作指令。結合智能代理、大語言模型和檢索增強生成(RAG)架構,就能為各類應用場景構建自優化的工作流,最終實現設計目標。”
MCP 協議也有望成為企業的產品差異化競爭優勢。斯里尼瓦桑表示:“隨著芯片企業的人工智能應用從‘副駕駛’向‘全職工作者’轉變,EDA 工具必須從根本上實現與這些人工智能工具的兼容。EDA 廠商完全可以通過搭建 MCP 服務器,讓外部系統以編程方式調取工具的內部數據、向工具輸入外部數據。目前尚不確定所有廠商是否都認為這一模式具有優勢,但頭部芯片企業必將推動這一發展方向,若某家 EDA 廠商拒絕跟進,這些企業便會選擇與之合作的競品,而 MCP 協議也將成為企業的核心競爭點。”
不過,MCP 協議的落地還需要考慮一些細節問題。德拉科表示:“如今整個行業都在討論 MCP 協議,搭建該協議本是為了讓工具的協作更高效,但我們發現,實際應用中并非所有場景都需要 MCP 協議,有時它甚至會成為阻礙。為人類編寫的文檔本就具備較高的參考價值,即便我們將其轉化為更適合機器讀取的格式,能提升的解析效率也十分有限,那又為何要耗費精力去做這件事?這正是人工智能的優勢所在 —— 即便數據格式不同,人工智能也只需多花一分鐘就能完成解析,而我們無需額外投入精力去開發、維護新的文檔或數據格式。”
問題的核心在于,MCP 協議的設計存在優劣之分。巴拉蘇布拉馬尼亞稱:“為一款產品搭建 MCP 服務器并非難事,但可能存在運行不暢的問題,或僅能在 20% 的場景下正常工作。每款產品都需要擁有專屬、規范的 MCP 服務器搭建方案,同時還需要一個高效的 MCP 編排器,對特定工作流中的所有 MCP 服務器進行統一管理,這一點至關重要。我們已發現部分客戶自行搭建了 MCP 服務器,但隨后反饋稱,為某款產品搭建的服務器無法正常運行,這是因為他們并非完全了解產品的底層邏輯。而由廠商自主搭建,才能打造出高效的 MCP 服務器。因此,MCP 協議的兼容性將成為行業核心,而這一趨勢已在逐步顯現。”
這一目標的實現,需要行業各方的協作。德拉科表示:“EDA 工程師是全球最頂尖的技術人才之一,他們同時精通軟件和硬件知識。行業內有大量軟件工程師和人工智能工程師,但他們對硬件設計一無所知;而硬件工程師雖掌握設計能力,卻只會使用 EDA 工程師開發的工具。EDA 是一個極具挑戰性的行業,目前行業的發展方向是正確的,從業者也在做著正確的探索,但整體仍處于‘野蠻生長’的階段,沒有人能預知最終的發展結果和行業變革。”
戴維曼對此表示認同:“我們需要將掌握設計、驗證等領域專業知識的人才,與人工智能專家匯聚在一起。只要雙方通力合作,兩年內就能取得突破性的成果。因為僅憑人工智能,無法解決 EDA 行業的核心問題;而 EDA 行業的發展,也需要人工智能技術實現下一代的跨越,二者的融合是必然趨勢。”











評論