- 聚焦制造業智能化轉型 中國科學技術大學依托昇騰突破知識增強大模型關鍵技術
- 2025年08月19日來源:中國網
提要:在全球工業革命的推動下,傳統制造業紛紛致力于智能化和數字化轉型,其關鍵在于將復雜且需專業知識的數據與機器學習結合,構建面向用戶的高效智能系統。在鯤鵬昇騰科教創新卓越中心的算力支持下,中國科學技術大學特任教授宋騏團隊基于昇騰平臺開發出了領域知識構建框架和領域大模型增強推理框架。
在全球工業革命的推動下,傳統制造業紛紛致力于智能化和數字化轉型,其關鍵在于將復雜且需專業知識的數據與機器學習結合,構建面向用戶的高效智能系統。在鯤鵬昇騰科教創新卓越中心的算力支持下,中國科學技術大學特任教授宋騏團隊基于昇騰平臺開發出了領域知識構建框架和領域大模型增強推理框架。
該項目在三方面開展了研究,并取得一系列成果。首先在構建工業知識圖譜領域,面對工業數據存在數據特征復雜、多模態異構的問題,團隊通過融合領域小模型與大語言模型的知識增強命名實體識別框架,以提升對知識圖譜實體抽取的準確性與泛化能力。其中昇騰分布式訓練加速庫MindSpeed發揮了重要作用,它支持多維并行策略,兼容多種開源框架,同時可靈活適配多模態數據的異構特征。團隊首先利用小模型進行前端精準篩選,將高質量的初始結果輸入至大語言模型,大語言模型通過其強大的語言理解和泛化能力對實體進行進一步的識別與確認。基于此融合框架完成“初始識別-知識抽取-知識引導反思”的三個階段,顯著提升了知識抽取的準確性和泛化能力。
應用到智能運維系統開發中,針對工業設備運維領域所面臨的高人工成本、數據分析不足及預測精度不高等問題,團隊提出了基于多模態知識圖譜的智能運維系統構建技術路線。首先該系統采用ETL(Extract-Transform-Load)架構對工業設備運維過程中產生的多模態數據進行統一處理,并對數據進行清洗后統一貯存。接著,利用深入理解資源描述框架 RDF語義網技術構建工業設備運維場景下的知識圖譜,清楚地展示出設備、狀態、故障之間的聯系。依托注意力機制的特征融合模型并結合Node2Vec和DeepWalk圖嵌入技術,將復雜的知識融合為能全面反應設備狀態的綜合特征。同時在設備運行中會出現異常或者故障,團隊也研發出故障智能預測診斷模塊,將異常數據特征與知識圖譜中的歷史故障進行同類對比,推理出故障類型、嚴重程度和維修建議,最終實現智能運維的全過程。
與此同時,為解決當前領域知識與大規模預訓練語言模型(PLM)融合中出現的計算資源消耗大、靈活性差和干擾噪聲知識過多等問題,團隊利用昇騰強大的計算資源管理能力,創新性地提出了知識增強與過濾框架。在實現知識增強環節,利用PLM嵌入空間的冗余位減低計算負擔;在噪聲過濾環節,設計知識增強過濾器,將知識增強網絡與掩碼訓練相結合,有效避免了噪聲知識的負面影響。在實現極大降低計算成本的同時,有效提高了知識增強的靈活性。
此科研成果構建了一套基于昇騰平臺的工業知識增強大模型技術體系,不僅顯著提升工業設備智能運維的水平和效率,還實現了核心技術的自主創新適配,融合前沿技術搭建智能系統,為打造安全、高效、智慧的現代工業體系提供關鍵技術支撐。未來,中國科學技術大學 鯤鵬昇騰科教創新卓越中心將基于昇騰平臺持續探索和創新,相關成果有望在更廣泛的工業場景中實現落地,助力科技創新與實體經濟的深度融合。