中國儲能網(wǎng)訊:2025年全國兩會期間,“人工智能”成為被頻繁提及和討論的熱門話題。全國人大代表、中國工程院院士、鵬城實驗室主任高文今年也提出了關(guān)于加快打造“人工智能先鋒城市”等建議。2025年年初,杭州深度求索公司發(fā)布的DeepSeek-R1大語言模型引發(fā)全球轟動,它的性能比肩國際頂尖模型,但開發(fā)成本僅為同類產(chǎn)品的三十分之一。鵬城實驗室已在開源社區(qū)上線DeepSeek系列模型,供國內(nèi)開發(fā)者測試驗證。
記者:DeepSeek的出現(xiàn)給你帶來什么影響?
高文:我覺得會把整個領(lǐng)域的應(yīng)用提早很多年,原來像ChatGPT、LLaMA、谷歌或者Facebook的大模型,要頭部企業(yè)有足夠的資源、算力、人才、數(shù)據(jù),才能把這個東西做出來?,F(xiàn)在國外人工智能的應(yīng)用,主要都是在幾個大廠手里,像微軟、谷歌等。DeepSeek出來就不一樣了,一下就把這個應(yīng)用平民化了,不是說只有少數(shù)頭部企業(yè),或者頂級玩家才玩得動,所有的初創(chuàng)企業(yè)都玩得動,這是它最大的貢獻(xiàn)。
DeepSeek的出現(xiàn),引發(fā)一系列連鎖反應(yīng),應(yīng)用門檻的降低,刺激更多的需求被釋放,導(dǎo)致全社會對算力的需求出現(xiàn)激增。如果把人工智能比作“智能汽車”,那么“算力”就是驅(qū)動它奔跑的“汽油”。唯有算力供給充足,人工智能才能得到充分的發(fā)展。
記者:如果從對算力的需求是增加的這個角度來看,你這個實驗室接下來的計劃和以前相比會有什么變化?
高文:開始沒有預(yù)料到會有這么快的需求,但現(xiàn)在我們要快速調(diào)整了。有很多工作要提前了。
高文領(lǐng)導(dǎo)的鵬城實驗室是中央批準(zhǔn)成立的網(wǎng)絡(luò)通信領(lǐng)域新型科研機構(gòu),主要任務(wù)之一就是圍繞“東數(shù)西算”“數(shù)字中國”“全國一體化算力網(wǎng)”等國家重大戰(zhàn)略,牽頭推進(jìn)“中國算力網(wǎng)”的研發(fā)與建設(shè)。
記者:你做的中國算力網(wǎng)的建設(shè),要解決的是什么問題?
高文:希望能夠?qū)崿F(xiàn)讓用戶像用電一樣使用算力,需要的話你就可以去購買,而且哪里的算力最便宜,你就購買哪里的算力。
這里所說的算力特指專門為AI訓(xùn)練設(shè)計的智能算力,不同于普通電腦的算力,它需要成千上萬顆專用芯片協(xié)同工作,同時也需要基礎(chǔ)設(shè)施的投入和能源的支持。
“東數(shù)西算”工程希望把東部需要計算的數(shù)據(jù)送到西部數(shù)據(jù)中心處理、結(jié)算和存儲,中國算力網(wǎng)建設(shè)的初衷,就是將散布在全國各地的計算資源進(jìn)行整合,包括超級計算中心、數(shù)據(jù)中心、云計算平臺等,形成一個統(tǒng)一的算力資源池,構(gòu)建資源方便接入、任務(wù)統(tǒng)一調(diào)度且具有可持續(xù)發(fā)展運營模式和機制的數(shù)字經(jīng)濟基礎(chǔ)設(shè)施,從而推動國內(nèi)自主算力資源邁入“全民共享”的時代。
記者:千行百業(yè)都在應(yīng)用,對算力會有影響嗎?
高文:應(yīng)該是比以前的需求更大了。
記者:需求很大,你能不能跟得上人家的需求呢?
高文:社會對算力的投入還是蠻大的,那當(dāng)然可能就不太平衡,有的算力投完了以后,使用效率比較高,有的可能使用效率比較低,水平參差不齊。我們希望通過算力網(wǎng),能夠把整個投入的資源利用率提高上來,其實這個也和當(dāng)初的電力網(wǎng)思路非常相近。當(dāng)時電力開始都是自己一個工廠給自己生產(chǎn)用,后來發(fā)現(xiàn)居民也需要用電,其他的事業(yè)單位也需要用電,所以到處在建電廠。有的地方可能建了也不夠用,有的可能建了就多了,那多了怎么辦呢,通過網(wǎng)絡(luò)把多余的電賣出去,算力網(wǎng)其實也是希望走類似的這條路。
我們現(xiàn)在就是要給這些算力建國家高速公路,首先用新的技術(shù)把它建起來,同時希望引入一些新的管理模式,不是常規(guī)那種通信的管理模式,用一些比如數(shù)據(jù)關(guān)聯(lián),現(xiàn)在我們也正在和國家數(shù)據(jù)局在一起溝通,用一種新的模式。
算力網(wǎng)的建設(shè)包含三個核心要素:大規(guī)模核心算力、超級光網(wǎng)絡(luò)和算力調(diào)度系統(tǒng)。它的理想圖景是當(dāng)我們需要用算力時,只需插上插頭,不用關(guān)心算力來自哪里,也無需自己比價,系統(tǒng)會自動匹配性價比最高的算力中心。這種模式不僅能提升現(xiàn)有算力資源利用率,還能避免各地重復(fù)建設(shè)造成的浪費。
記者:如果我們各方面哪怕有一點跟不上的話,可能在AI的競爭上面就會落后,現(xiàn)在是這種局面嗎?
高文:是,因為這是一個系統(tǒng)性的。
記者:你現(xiàn)在會焦急嗎?
高文:應(yīng)該不會,技術(shù)上其實我們還是蠻自信的,按部就班地往前走,還是非常自信的,當(dāng)然我們也希望拿到最好的東西,比如最好工藝的東西,最好軟件的東西,包括機器也是最快的,世界上最領(lǐng)先的。但是現(xiàn)在卡了以后,我們就只能比如用集成的技術(shù)去做出最好的設(shè)備來。
由于算力網(wǎng)中的計算任務(wù)可能涉及科學(xué)研究、國防、金融等關(guān)鍵領(lǐng)域,防止數(shù)據(jù)泄露和網(wǎng)絡(luò)攻擊成為算力網(wǎng)建設(shè)和運營中的重要任務(wù)。鵬城實驗室有專門的團隊致力于網(wǎng)絡(luò)安全技術(shù)的科研與應(yīng)用。不久前剛結(jié)束的第九屆亞洲冬季運動會,鵬城實驗室參與了亞冬會的網(wǎng)絡(luò)安全保障。
記者:要保護(hù)什么?
高文:很多的管理都是在網(wǎng)上管的。一旦這個系統(tǒng)被攻擊,癱瘓了,整個就全部癱瘓了。
記者:這種被攻擊的風(fēng)險是想象出來的,還是現(xiàn)實世界中真實存在的?
高文:現(xiàn)實世界中存在的,有的是屬于惡意的,就是要讓你難堪。還有很多黑客,是為了顯示我厲害,就是我能攻進(jìn)去,我能把你搞癱瘓了。這兩類性質(zhì)都有。
記者:在網(wǎng)絡(luò)上保障安全,一些商業(yè)化的公司,甚至都可以去做,那為什么你要去做?
高文:遇到很難的問題,需要團隊實力非常強,有一些商業(yè)公司,它不見得解決得了。
記者:它的難點是在哪兒?
高文:常規(guī)的那些公司用的一般方法,比如上一個工具程序,從頭到尾把數(shù)據(jù)掃一遍,看看里面有沒有異常。但是通常高手不會讓你找到,所以可能就需要技術(shù)更專業(yè)一點,我們這個團隊有很多工具,看響應(yīng)是什么,根據(jù)這個再來分析,可能會有蛛絲馬跡,最后把東西挖出來。
2022年,“中國算力網(wǎng)”一期工程“智算網(wǎng)絡(luò)”正式上線。它連接并管理了20多個不同地域、不同類型的算力中心,匯聚算力規(guī)模逐步增加到5E Flops,相當(dāng)于每秒完成5萬億億次計算。其算力樞紐節(jié)點之一,就是鵬程實驗室的人工智能算力平臺“鵬城云腦Ⅱ”。
高文:你從這看過去,這是八行,八行其實就相當(dāng)于是四臺機器,每兩行是一臺機器。
記者:你那它的耗電量大不大?
高文:不小,每個月可能都要一兩百萬的電費。
“鵬城云腦Ⅱ”是鵬城實驗室與相關(guān)企業(yè)聯(lián)合研發(fā)的超級智能計算機,峰值算力達(dá)到每秒完成100億億次計算,于2020年啟動運行。它比每秒能完成100千萬億次計算的“鵬城云腦Ⅰ”,計算能力強了10倍,而完成這次升級,僅用了一年時間。
記者:只用了一年提高了10倍?發(fā)生了什么?
高文:我們做“鵬城云腦I”的時候,那時候還是做判別式人工智能,通常它需要的算力沒有那么大,100P其實已經(jīng)可以滿足需要了。通常我們會預(yù)判,對語言模型需要的計算和存儲的能力,會比圖像的應(yīng)該要求更高一些,因為語言的語料更容易獲得,可能語言處理需要的處理能力更強,所以要比做圖像大10倍。
目前,“鵬城云腦Ⅱ”已在衡量全球高性能平臺數(shù)據(jù)吞吐能力的IO500總榜單上連續(xù)9次取得冠軍,同時在國際人工智能算力性能AIPerf500排行榜上連續(xù)4屆排名第一。基于“鵬城云腦Ⅱ”,鵬城實驗室搭建了一個AI訓(xùn)練平臺,能夠同時處理包含上千億參數(shù)的超大規(guī)模AI模型?!谤i城·腦?!本褪蛆i城實驗室在“鵬城云腦Ⅱ”上訓(xùn)練和運行的一個超大規(guī)模自然語言處理模型。
記者:為什么腦海沒跑出來,DeepSeek跑出來了?
高文:倒不是說我們腦海不行,其實這個就是DeepSeek很聰明的地方,腦海和ChatGPT完全是同樣的技術(shù),它里面有一個模型叫注意力機制,像以前比如一篇文章,進(jìn)到計算機里面,你讓它處理,等處理到最后,前面的已經(jīng)忘了。但是GPT就是Transformer,發(fā)明了一種方式,叫注意力機制,或者叫注意力模型,就是我只注意相關(guān)的,其他東西我就不管了,抓大放小。
原來的GPT是一個大包,所有的功能都在里面,所以用的時候就很累。DeepSeek就做了這樣一件事,他把特定領(lǐng)域用特定的表述去訓(xùn)練它,這樣訓(xùn)練的時候,開銷就沒那么大。它一共有256個專家,使用的時候不需要256個都裝,最多裝8個就夠了,這樣用的時候,需要的成本很低,訓(xùn)練的時間可以節(jié)省。DeepSeek我認(rèn)為它不是理論上的創(chuàng)新,它更多是工程上。
目前,“鵬城·腦?!贝竽P偷膬蓚€版本已向社會開源。高文和團隊希望通過模型訓(xùn)練全流程開源開放的方式,將“鵬城·腦?!迸嘤秊橹袊懔W(wǎng)上的一個種子應(yīng)用。
記者:你是最底層的這個源代碼開源還是參數(shù)開源?
高文:其實兩層都有,我們是把所有參數(shù),我們叫切片,就是它在訓(xùn)練過程中,我每隔多長時間,我就開一個切片,研究者可以通過這個切片,去研究它在訓(xùn)練的過程中,它是怎么受訓(xùn)練的,中間有什么變化。另外我們源代碼也開源,源代碼開源以后,基本上用戶其實拿著這個源代碼,用他自己的數(shù)據(jù)就可以重新再去訓(xùn)練。
記者:那你付出所有的人、精力、資金,等于是你做了別人得益,可以這樣理解嗎?
高文:但是開源不僅僅是別人得益的問題。我開源了以后,別人在我這開源的東西,他也要開源,他開源以后,會使原來我的系統(tǒng)做得更好,然后我們會在所有開源的東西之上,再往上迭代,眾人拾柴火焰高,所有參與的人都在添柴,都在加火。
培育出“鵬城·腦海”的算力平臺“鵬城云腦Ⅱ”同樣秉持開放理念?!谤i城云腦Ⅱ”算力的50%是鵬城實驗室自研使用,40%開放提供給國內(nèi)的合作伙伴、科研機構(gòu)和高校,10%則釋放給深圳市工業(yè)和信息化局,供社會開發(fā)者申請使用。在人工智能浪潮中,開源與開放精神正在成為業(yè)界共識。
記者:開源就意味著共享,對吧?共享和競爭矛盾不矛盾?
高文:其實從開源的角度,技術(shù)是不是自己的沒關(guān)系,因為你就在那上面迭代。為什么現(xiàn)在OpenAI比較難受,因為它是閉源的,閉源就是別人只能求他,要和他簽協(xié)議,他同意才行,他不同意就不行。
高文:這是整個生態(tài)的兩條技術(shù)路線,這個生態(tài)早期都是閉源的,因為有版權(quán),實際上是保護(hù)你這個軟件的權(quán)利的。但是后來Linux(操作系統(tǒng))是第一個把軟件開源的,他的理念是這個東西是人類的資產(chǎn),我把它放出來,但是我要求所有用這個軟件的人,在上面做開發(fā)的人,你要給我一個承諾,就是我開源了,你要新做的東西你也要開源。
我個人理解就是開源可能更符合人類社會發(fā)展的方向,這和知識是一樣的,以前那些手藝人、工匠,很多東西是代代相傳的,萬一哪一輩沒傳好就失傳了,那后來為什么我們現(xiàn)在學(xué)的知識,每個人都可以學(xué),因為這個東西開源了,知識就是開源的。
其實軟件也一樣,如果軟件也變成知識,那你就應(yīng)該開源,開源以后才能迭代。
“鵬城云腦Ⅱ”平穩(wěn)運行的同時,高文已經(jīng)開始著眼新的問題。目前,他正帶領(lǐng)團隊聯(lián)合相關(guān)企業(yè)研發(fā)下一代超級智能計算機“鵬城云腦Ⅲ”,智能算力規(guī)模目標(biāo)為每秒完成1600億億次計算,能力比“鵬城云腦Ⅱ”提升16倍。
記者:這個云腦Ⅲ未來可以做什么事?
高文:可以做多模態(tài)大模型的訓(xùn)練和使用,現(xiàn)在大語言模型的智能只是語言智能,其他智能還比較弱一點。所謂多模態(tài)模型,就是除了語言之外,我要把聲音、視覺和語言都摻雜在一起,然后去訓(xùn)練,這樣整個智能的水平,就和人慢慢比較接近了。我們也希望通過我們這臺機器的建設(shè),對國內(nèi)的生態(tài)有所幫助。
整個機器還沒出來,但是我們的原型機已經(jīng)出來了。我們整個機器是157個機柜,但是我們現(xiàn)在已經(jīng)做了3個機柜了,這些模型已經(jīng)在這3個機柜上的原型機上面做訓(xùn)練,國家給我們的使命,是要去攻一個山頭,就是要爬一個高峰,這個高峰肯定是別人都沒有上去過的,所以你要先上去。