中國(guó)儲(chǔ)能網(wǎng)訊:生成式人工智能(AI)大模型已成為當(dāng)前第三次AI浪潮的研究熱點(diǎn),代表了AI技術(shù)最新發(fā)展趨勢(shì),將引領(lǐng)三場(chǎng)革命:人機(jī)交互革命,人與機(jī)器的自然語(yǔ)言溝通更加自然高效;認(rèn)知協(xié)作革命,大模型運(yùn)用自身認(rèn)知能力與人類共同解決復(fù)雜問(wèn)題;計(jì)算范式革命,推動(dòng)以中央處理器(CPU)主導(dǎo)向以圖形處理器(GPU)為核心的AI計(jì)算體系轉(zhuǎn)變。
演進(jìn)方向: 安全可靠融入核心業(yè)務(wù)
在能源電力領(lǐng)域,生成式AI技術(shù)正在快速發(fā)展,已經(jīng)出現(xiàn)多個(gè)行業(yè)大模型。例如,國(guó)內(nèi)首個(gè)千億級(jí)多模態(tài)行業(yè)大模型——光明電力大模型可以為電網(wǎng)安全穩(wěn)定運(yùn)行、促進(jìn)新能源消納、做好供電服務(wù)提供“超級(jí)大腦”;昆侖大模型支持油氣新能源、煉化新材料等專業(yè)海量數(shù)據(jù)建模需求。
能源電力行業(yè)應(yīng)用場(chǎng)景豐富、運(yùn)行機(jī)理復(fù)雜、樣本模式眾多、安全約束嚴(yán)格,如何將人工智能技術(shù)安全、可靠地融入行業(yè)核心業(yè)務(wù),從海量數(shù)據(jù)中提取模式、預(yù)測(cè)趨勢(shì)、優(yōu)化決策,從而支撐能源電力安全、經(jīng)濟(jì)、低碳運(yùn)行,進(jìn)而實(shí)現(xiàn)能源電力資源的高效配置和利用,是我們必須面對(duì)和解決的關(guān)鍵問(wèn)題。
同時(shí),我們也看到,能源電力系統(tǒng)是高維度非線性復(fù)雜巨系統(tǒng),其結(jié)構(gòu)形態(tài)、運(yùn)行機(jī)理和技術(shù)基礎(chǔ)正在發(fā)生深刻變化,基于物理方程數(shù)值計(jì)算的傳統(tǒng)預(yù)測(cè)、分析、決策方法難以為繼。因此,需要瞄準(zhǔn)新型電力系統(tǒng)高維非線性復(fù)雜動(dòng)力學(xué)特性觀測(cè)、預(yù)測(cè)、決策等科學(xué)計(jì)算難題,開創(chuàng)融合物理方程數(shù)值計(jì)算、神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)驅(qū)動(dòng)、符號(hào)邏輯數(shù)理推導(dǎo)的電力專用計(jì)算范式;著重考慮將能源電力系統(tǒng)動(dòng)力學(xué)特性原生嵌入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,進(jìn)而構(gòu)建面向高維復(fù)雜動(dòng)力學(xué)特性的符號(hào)邏輯觀測(cè)補(bǔ)強(qiáng)方法,研發(fā)融合高維復(fù)雜動(dòng)力學(xué)特性的符號(hào)邏輯求解加速模型,探索基于符號(hào)邏輯計(jì)算框架的高維復(fù)雜動(dòng)力學(xué)特性符號(hào)回歸方法。通過(guò)以上探索,支撐新型電力系統(tǒng)源荷預(yù)測(cè)、建模仿真、方式分析、優(yōu)化調(diào)度等四類核心業(yè)務(wù),甚至輔助發(fā)現(xiàn)新的能源電力運(yùn)行控制規(guī)律。
目前業(yè)界正深入研究能源電力大模型研發(fā)路徑、應(yīng)用模式,打造專用底座,推動(dòng)行業(yè)大模型參與能源電力業(yè)務(wù)全流程、嵌入全環(huán)節(jié)。
研發(fā)路徑: 構(gòu)建電力原生時(shí)序大模型
從“世界的本質(zhì)是數(shù)學(xué)”這個(gè)角度看,所有的問(wèn)題都能夠用一個(gè)高維度的非線性的數(shù)學(xué)方程組來(lái)描述,從宏大的能源社會(huì)電力復(fù)雜系統(tǒng),到微觀的一個(gè)裝置設(shè)備,都可以用數(shù)學(xué)的思維進(jìn)行描述、展開計(jì)算。
人們期待通過(guò)人工智能技術(shù)找到一種工具,去高效描述復(fù)雜的高維非線性系統(tǒng),進(jìn)而找到一種分析方法去觀測(cè)、預(yù)測(cè)和決策。目前的現(xiàn)實(shí)是,基于神經(jīng)網(wǎng)絡(luò)技術(shù)的新一代大語(yǔ)言模型,還是依賴統(tǒng)計(jì)概率性,去等效或者逼近任意復(fù)雜的高維非線性動(dòng)態(tài)系統(tǒng)。這決定了大語(yǔ)言模型只具備統(tǒng)計(jì)相關(guān)性,欠缺邏輯因果性,不具備邏輯推理的能力。
當(dāng)下大量行業(yè)大模型所采取的研發(fā)技術(shù)路線是,選擇通用大模型作為基座模型,然后使用大量行業(yè)通識(shí)數(shù)據(jù)進(jìn)行增量預(yù)訓(xùn)練,使之適應(yīng)行業(yè)特性并掌握領(lǐng)域內(nèi)的專業(yè)知識(shí);通過(guò)行業(yè)專家對(duì)模型輸出結(jié)果進(jìn)行標(biāo)注,再結(jié)合多輪專家反饋強(qiáng)化學(xué)習(xí),進(jìn)一步提升模型在行業(yè)任務(wù)上的專業(yè)性和準(zhǔn)確性。
這樣的研發(fā)路徑雖然能夠快速構(gòu)建適配行業(yè)需求的大模型,但存在一些不足:增量預(yù)訓(xùn)練依賴于大量高質(zhì)量行業(yè)數(shù)據(jù),而行業(yè)數(shù)據(jù)的收集、清洗和標(biāo)注成本高昂;專家反饋學(xué)習(xí)需要大量專業(yè)人員參與,耗時(shí)且主觀性強(qiáng);能源電力的物理特性未能深度嵌入大模型構(gòu)建過(guò)程,導(dǎo)致訓(xùn)練和推理結(jié)果無(wú)法完全滿足可信人工智能的要求。
近一年多來(lái),筆者在擔(dān)任未來(lái)產(chǎn)業(yè)類腦計(jì)算、算力網(wǎng)絡(luò)項(xiàng)目執(zhí)行負(fù)責(zé)人期間逐步認(rèn)識(shí)到,傳統(tǒng)AI研發(fā)路徑(即基于大數(shù)據(jù)量、大參數(shù)量、大計(jì)算量的訓(xùn)練方式)已難以滿足實(shí)際應(yīng)用性能需求,尤其在電力行業(yè)這種高時(shí)效性、高精度要求的領(lǐng)域面臨瓶頸。
因此,嘗試從0到1構(gòu)建電力原生時(shí)序大模型是一種解決思路。電力系統(tǒng)主要處理的數(shù)據(jù)不是圖像、文本,而是能夠捕捉電力系統(tǒng)實(shí)時(shí)變化的電氣量、化學(xué)量等時(shí)序數(shù)據(jù)。從大模型構(gòu)建初始就需要把物理方程、符號(hào)邏輯等因素融合進(jìn)神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),將電力物理規(guī)律與AI智算能力深度結(jié)合。由此,可以進(jìn)一步構(gòu)建出專業(yè)中模型和業(yè)務(wù)小模型,通過(guò)大中小模型的協(xié)同進(jìn)化,實(shí)現(xiàn)從全局到局部、從理論到應(yīng)用的深度融合。大模型提供宏觀視角和全局分析能力,中模型處理專業(yè)領(lǐng)域具體需求,小模型快速響應(yīng)業(yè)務(wù)變化。
應(yīng)用模式:構(gòu)建電力具身智能體
目前,行業(yè)大模型應(yīng)用模式主要包括網(wǎng)頁(yè)訪問(wèn)、接口調(diào)用和私有化部署。網(wǎng)頁(yè)訪問(wèn)方式較為通用,用戶通過(guò)瀏覽器在線訪問(wèn)大模型;接口調(diào)用則通過(guò)開放應(yīng)用程序編程接口(API),將大模型功能集成到企業(yè)的業(yè)務(wù)系統(tǒng)中;私有化部署則將大模型部署到企業(yè)本地環(huán)境中,確保數(shù)據(jù)隱私合規(guī),但對(duì)本地計(jì)算推理硬件有性能要求。
上述三種應(yīng)用模式的不足之處在于:網(wǎng)頁(yè)訪問(wèn)方式與企業(yè)的具體業(yè)務(wù)流程關(guān)聯(lián)性較弱,更多是作為獨(dú)立工具存在;接口調(diào)用發(fā)揮的作用往往局限于特定任務(wù)處理,無(wú)法實(shí)現(xiàn)對(duì)業(yè)務(wù)流和信息流的真正嵌入;私有化部署具有較高的成本和技術(shù)門檻,目前停留在輔助工具層面??傊?,三種模式更多是對(duì)傳統(tǒng)人機(jī)交互的升級(jí),難以實(shí)現(xiàn)真正意義上的認(rèn)知協(xié)作、計(jì)算范式變革,模型潛力尚未得到充分釋放。
總體來(lái)看,目前大模型的應(yīng)用還處于一種個(gè)人(To C)應(yīng)用的階段,真正的行業(yè)(To B)應(yīng)用需要模型解決業(yè)務(wù)問(wèn)題。它不能僅僅是問(wèn)答,或者通過(guò)串聯(lián)運(yùn)行方式輔助決策,而應(yīng)該是一種串并聯(lián)或者相互協(xié)作的運(yùn)行方式,最終實(shí)現(xiàn)從人機(jī)協(xié)同的界面到認(rèn)知協(xié)作功能的跨越。
問(wèn)題的根源在于大模型實(shí)現(xiàn)了業(yè)務(wù)認(rèn)知而無(wú)法付諸行動(dòng),因此前述三種應(yīng)用模式未能實(shí)現(xiàn)全業(yè)務(wù)環(huán)節(jié)參與、全業(yè)務(wù)架構(gòu)嵌入。
我國(guó)電力系統(tǒng)是世界上規(guī)模最大、結(jié)構(gòu)最復(fù)雜、能源轉(zhuǎn)型最快的人造巨系統(tǒng),在電力平衡、系統(tǒng)調(diào)控、設(shè)備運(yùn)維、人員作業(yè)等方面面臨諸多挑戰(zhàn),需借助先進(jìn)人工智能技術(shù)提升狀態(tài)感知、運(yùn)行認(rèn)知、控制決策的智能化水平?!傲可怼庇?xùn)練能源領(lǐng)域的大模型,將為數(shù)實(shí)融合尋找可行的新路徑。
大模型要融入電力系統(tǒng)各業(yè)務(wù)環(huán)節(jié),一個(gè)有效的解決思路是,將近年來(lái)興起的具身智能與智能體相結(jié)合,構(gòu)建電力具身智能體,為大模型添加“可行動(dòng)的軀體”。
電力具身智能體的核心在于依托云邊端算力底座,采用大模型和業(yè)務(wù)小模型構(gòu)建智能體,以具身進(jìn)化技術(shù)指導(dǎo)智能體自主學(xué)習(xí)。智能體中的小模型負(fù)責(zé)執(zhí)行具體作業(yè)任務(wù),大模型負(fù)責(zé)對(duì)小模型進(jìn)行調(diào)度編排,并按需發(fā)起與云側(cè)行業(yè)大模型的云邊協(xié)同進(jìn)化;具身智能體能夠?qū)崿F(xiàn)跨層級(jí)、跨場(chǎng)景的數(shù)據(jù)、知識(shí)、模型協(xié)同,實(shí)現(xiàn)從數(shù)據(jù)感知到分析、決策、規(guī)劃及行動(dòng)的閉環(huán)進(jìn)化,確保對(duì)電力業(yè)務(wù)的實(shí)時(shí)感知、精準(zhǔn)分析、科學(xué)規(guī)劃,并迅速執(zhí)行決策。
(作者系中國(guó)電力科學(xué)研究院正高級(jí)工程師,電力異構(gòu)融合類腦計(jì)算關(guān)鍵技術(shù)研究項(xiàng)目負(fù)責(zé)人、電力人工智能大模型分布式算力調(diào)度與協(xié)同訓(xùn)練推理項(xiàng)目執(zhí)行負(fù)責(zé)人。)