中國(guó)儲(chǔ)能網(wǎng)訊:在數(shù)字經(jīng)濟(jì)潮涌與大模型井噴的時(shí)代,算力正如水、電一般,逐日成為現(xiàn)代社會(huì)賴(lài)以生存的稀缺資源。可以說(shuō),誰(shuí)擁有了算力的主導(dǎo)權(quán),誰(shuí)就捏住了面向人工智能的頭等船票。
這樣的時(shí)代巨浪下,我國(guó)的算力也已步入高速發(fā)展新階段。在此過(guò)程中,構(gòu)建全國(guó)一體化算力網(wǎng),更是應(yīng)對(duì)新一輪科技革命和產(chǎn)業(yè)變革的重要舉措。
在“東數(shù)西算”工程公布兩年之際,當(dāng)前我國(guó)算力網(wǎng)體系建設(shè)現(xiàn)狀怎樣?如何進(jìn)一步強(qiáng)化全國(guó)一體化算力體系?就此,21世紀(jì)經(jīng)濟(jì)報(bào)道推出“算力網(wǎng)風(fēng)云”系列報(bào)道,圍繞中國(guó)算力一體化體系建設(shè)現(xiàn)狀、難點(diǎn)與堵點(diǎn)、產(chǎn)業(yè)鏈機(jī)會(huì)等進(jìn)行全方位解讀。
AI大模型加速迭代和探路應(yīng)用背景下,智能計(jì)算需求正迅速增長(zhǎng)。高密度、高算力、高效能正成為智算中心的發(fā)展趨勢(shì)。
中國(guó)移動(dòng)通信研究院發(fā)布的《面向超萬(wàn)卡集群的新型智算技術(shù)白皮書(shū)》中提到,隨著模型參數(shù)量從千億邁向萬(wàn)億,模型能力更加泛化,大模型對(duì)底層算力的訴求進(jìn)一步升級(jí),超萬(wàn)卡集群成為本輪大模型基建軍備競(jìng)賽的標(biāo)配。
當(dāng)然與此同時(shí),IDC行業(yè)本身正經(jīng)歷上一輪大規(guī)模建設(shè)的周期尾聲,行業(yè)出現(xiàn)階段性供過(guò)于求行情。新的市場(chǎng)趨勢(shì)則對(duì)行業(yè)提出從傳統(tǒng)數(shù)據(jù)中心向新型智算中心升級(jí)需求,由此考驗(yàn)著數(shù)據(jù)中心服務(wù)商的綜合能力。
參與者正積極競(jìng)速。根據(jù)中國(guó)信通院測(cè)算,2022年數(shù)據(jù)中心業(yè)務(wù)市場(chǎng)收入約達(dá)1900億元,近三年年均復(fù)合增長(zhǎng)率為27.2%。第三方數(shù)據(jù)中心服務(wù)商市場(chǎng)份額保持高速增長(zhǎng),首次超越基礎(chǔ)電信運(yùn)營(yíng)商,占據(jù)市場(chǎng)主導(dǎo)地位。
但在當(dāng)前階段,AI大模型驅(qū)動(dòng)的更高智算需求背后,不僅是依靠單一產(chǎn)業(yè)角色的探路發(fā)展,還需要完整產(chǎn)業(yè)鏈攜手推進(jìn)。
第三方IDC躍起
全國(guó)如火如荼推進(jìn)數(shù)據(jù)中心建設(shè)過(guò)程中,更多元化的角色參與進(jìn)來(lái),甚至對(duì)既有行業(yè)格局帶來(lái)變數(shù)。
中國(guó)信通院統(tǒng)計(jì)顯示,基礎(chǔ)電信運(yùn)營(yíng)商和第三方數(shù)據(jù)中心服務(wù)商是我國(guó)數(shù)據(jù)中心市場(chǎng)的重要參與者,在2022年后者開(kāi)始占據(jù)主導(dǎo)地位。
其中,基礎(chǔ)電信運(yùn)營(yíng)商掌握優(yōu)質(zhì)資源,注重前瞻性布局,促進(jìn)東西部比例平衡。第三方IDC服務(wù)商的參與角色也越來(lái)越豐富,除了大型服務(wù)商在積極發(fā)展,小型服務(wù)商也不斷涌現(xiàn),行業(yè)市場(chǎng)迎來(lái)加速整合期。
總體來(lái)看,一方面頭部第三方數(shù)據(jù)中心企業(yè)具有更強(qiáng)的資金實(shí)力、資源儲(chǔ)備和品牌影響力;另一方面市場(chǎng)整合會(huì)促進(jìn)行業(yè)的集中度提高,進(jìn)一步增強(qiáng)他們?cè)谫Y金和資源方面的優(yōu)勢(shì)。
秦淮數(shù)據(jù)集團(tuán)CTO張炳華對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,秦淮數(shù)據(jù)業(yè)務(wù)發(fā)展主要得益于數(shù)字經(jīng)濟(jì)與人工智能迅猛發(fā)展所催生的強(qiáng)勁需求,以及公司在超大規(guī)模數(shù)據(jù)中心建設(shè)模式的核心優(yōu)勢(shì)。
他分析道,“我們與其他數(shù)據(jù)中心服務(wù)商提供的‘超市/便利店模式’,或稱(chēng)‘零售模式’有所不同,零售模式以提供通用型的產(chǎn)品方案為主;秦淮數(shù)據(jù)則主要以頭部客戶(hù)的剛性需求為主,聚焦為客戶(hù)提供大規(guī)?;虺笠?guī)模定制化解決方案。除了能迅速響應(yīng)客戶(hù)需求外,還需要根據(jù)行業(yè)發(fā)展趨勢(shì)提前進(jìn)行資源布局?!?
因此,秦淮數(shù)據(jù)集團(tuán)會(huì)密切關(guān)注行業(yè)技術(shù)動(dòng)態(tài),比如英偉達(dá)的GPU芯片發(fā)展和技術(shù)要求,前瞻性地開(kāi)展100kW以上高密度機(jī)柜的供電、冷卻等方案研究,針對(duì)AI時(shí)代大模型業(yè)務(wù)場(chǎng)景開(kāi)展系統(tǒng)架構(gòu)全棧規(guī)劃。
他還提到,“在當(dāng)前算力服務(wù)市場(chǎng)比較‘內(nèi)卷’、同質(zhì)化競(jìng)爭(zhēng)嚴(yán)重、部分區(qū)域資源趨于飽和的背景下,‘以需定供’可以有效減少無(wú)序發(fā)展帶來(lái)的資源浪費(fèi),‘以供創(chuàng)需’則要求數(shù)據(jù)中心企業(yè)不斷提升自身的技術(shù)、建設(shè)和運(yùn)營(yíng)實(shí)力,從而吸引更多需求,提升上架率。秦淮數(shù)據(jù)集團(tuán)2023年已投運(yùn)數(shù)據(jù)中心上架率達(dá)到87%,遠(yuǎn)高于行業(yè)平均水平?!?
潤(rùn)澤科技副董事長(zhǎng)、總經(jīng)理李笠在近期業(yè)績(jī)交流會(huì)中在談及對(duì)2024年業(yè)務(wù)展望中分析道,AIDC的增速主要受終端用戶(hù)的需求、融資能力、高性能設(shè)備供應(yīng)情況等因素影響。隨著Sora為代表的文生視頻大模型進(jìn)一步點(diǎn)爆AI行業(yè)、應(yīng)用逐漸落地,智算中心需求進(jìn)一步增長(zhǎng)?!澳壳伴L(zhǎng)三角和京津冀市場(chǎng)對(duì)AIDC需求很旺盛,公司將加速推動(dòng)現(xiàn)有用戶(hù)的訂單落地,積極開(kāi)拓新用戶(hù)群體,盡快交付能承載10萬(wàn)卡集群的智算中心?!?
但他同時(shí)指出,目前國(guó)內(nèi)最大的卡集群是萬(wàn)卡,美國(guó)先進(jìn)公司早在去年底就達(dá)到10萬(wàn)卡集群,這是整個(gè)中國(guó)產(chǎn)業(yè)鏈的一場(chǎng)接力賽,每個(gè)環(huán)節(jié)都要接好自己手中的接力棒,為中國(guó)AI加一份力。
從趨勢(shì)來(lái)說(shuō),Omdia云與數(shù)據(jù)中心研究的首席分析師Alan Howard對(duì)記者分析道,第三方數(shù)據(jù)中心行業(yè)受益于兩大市場(chǎng)動(dòng)態(tài):一是越來(lái)越多企業(yè)將業(yè)務(wù)遷移到這些數(shù)據(jù)中心運(yùn)行,需求驅(qū)動(dòng)因素持續(xù)增加;二是許多云和流媒體等公司更愿意不建立或無(wú)法快速建設(shè)數(shù)據(jù)中心。由此Omdia預(yù)計(jì)未來(lái)三到五年內(nèi)數(shù)據(jù)中心需求仍將保持高位。
“IDC的上一輪建設(shè)周期在2020~2021年間,伴隨云計(jì)算的高增長(zhǎng),IDC建設(shè)也迎來(lái)高增長(zhǎng)時(shí)期。但隨著這些年間供給大幅增加,但宏觀環(huán)境承壓背景下,云計(jì)算和互聯(lián)網(wǎng)行業(yè)需求增速低于供給,造成階段性供給過(guò)剩。市場(chǎng)上一些碎片化的第三方IDC也在產(chǎn)能出清?!鼻笆鯥DC分析師對(duì)記者分析,這導(dǎo)致行業(yè)整體增速有所下滑、出現(xiàn)價(jià)格戰(zhàn)。
“我們認(rèn)為基礎(chǔ)電信運(yùn)營(yíng)商和第三方數(shù)據(jù)中心服務(wù)商并非非此即彼,二者很多時(shí)候形成了合作關(guān)系。運(yùn)營(yíng)商的機(jī)架一方面為自建自用,另一方面則是對(duì)于優(yōu)質(zhì)IDC需求選擇與第三方IDC合建?!鼻笆鯥DC分析師指出,IDC作為一個(gè)周期性行業(yè),預(yù)計(jì)最晚到2025年,行業(yè)供需關(guān)系將進(jìn)一步改善。
從通算到智算
伴隨AI大模型快速迭代發(fā)展,當(dāng)前市場(chǎng)對(duì)算力需求已由傳統(tǒng)數(shù)據(jù)中心向智算中心轉(zhuǎn)變。
張炳華對(duì)記者表示,傳統(tǒng)通用計(jì)算采用的機(jī)柜單機(jī)功率相對(duì)較低,但異構(gòu)(智能)計(jì)算對(duì)數(shù)據(jù)中心規(guī)模、單機(jī)柜功率密度,以及冷卻方式均提出了更高的要求。
具體來(lái)說(shuō),首先是數(shù)據(jù)中心集群規(guī)模持續(xù)擴(kuò)大,單個(gè)集群規(guī)模通常需達(dá)到30~50兆瓦以上;其次是單機(jī)柜功率密度大幅攀升,由每柜幾個(gè)千瓦提升到幾十個(gè)千瓦;以英偉達(dá)最新發(fā)布的Blackwell GB200 GPU異構(gòu)計(jì)算為例,其單機(jī)柜功耗高達(dá)120千瓦,相當(dāng)于CPU通用計(jì)算單機(jī)柜功耗的10~20倍;再次,隨著單機(jī)柜功率密度提升,原來(lái)的風(fēng)冷方案已經(jīng)不能滿(mǎn)足高功率密度冷卻要求,冷卻方案也逐漸從風(fēng)冷轉(zhuǎn)向液體冷卻。
“在大模型計(jì)算過(guò)程中,集群規(guī)模越大、算力越強(qiáng)、計(jì)算時(shí)間越短、效果就越好。因此,我們對(duì)算力基礎(chǔ)設(shè)施的設(shè)計(jì)規(guī)劃、選址、運(yùn)營(yíng)都要做出相應(yīng)的調(diào)整和優(yōu)化?!彼a(bǔ)充道,在此過(guò)程中對(duì)網(wǎng)絡(luò)帶寬、電力容量、供水能力等配套設(shè)施也需要同步升級(jí)。
另外,數(shù)據(jù)中心從通用計(jì)算跨越到異構(gòu)(智能)計(jì)算,不僅是技術(shù)層面的改變,更類(lèi)似于APP平臺(tái)從iOS遷移到安卓,代表著整個(gè)生態(tài)系統(tǒng)都會(huì)全部重構(gòu)。然而,在智算生態(tài)建設(shè)初期,各個(gè)方面不夠成熟的情況下,GPU整體運(yùn)行速度和性能可能暫時(shí)無(wú)法得到充分發(fā)揮。
Omdia云與數(shù)據(jù)中心研究首席分析師王珅還對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析,在轉(zhuǎn)型升級(jí)過(guò)程中,技術(shù)上主要面臨電力容量、冷卻系統(tǒng)容量、供電和制冷架構(gòu)效率不高等挑戰(zhàn);以及算力硬件供應(yīng)不足和多種架構(gòu)算力硬件融合統(tǒng)一的挑戰(zhàn)。商業(yè)層面則主要是智算中心目前上架率不高的問(wèn)題,這可能會(huì)影響商業(yè)模式閉環(huán)。
一名IDC分析師對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者指出,從傳統(tǒng)IDC轉(zhuǎn)向AIDC過(guò)程中門(mén)檻在提高?!昂?jiǎn)單來(lái)說(shuō),傳統(tǒng)IDC服務(wù)商類(lèi)似房地產(chǎn)公司提供毛坯房,這是一套已經(jīng)流程化的工作,完成需求調(diào)研—建設(shè)—上架—運(yùn)維等規(guī)范化流程即可。但AIDC需要更多能力加持,類(lèi)似提供拎包入住的公寓式服務(wù),這要兼顧PUE(數(shù)據(jù)中心能源效率的指標(biāo))和算力集群利用率等平衡,大幅提高了運(yùn)營(yíng)門(mén)檻?!?
他進(jìn)一步表示,智算中心建設(shè)需求將涉及更為復(fù)雜的技術(shù)和運(yùn)維等挑戰(zhàn),“核心原因在于當(dāng)前AI生態(tài)還不健全,但客戶(hù)層面要求整體運(yùn)營(yíng)能力,導(dǎo)致IDC服務(wù)商可能面臨很多試錯(cuò)成本。當(dāng)然在此過(guò)程中也積累了更多能力,更好幫助他們從傳統(tǒng)IDC服務(wù)商向算力運(yùn)營(yíng)商角色轉(zhuǎn)型。算力租賃就是一個(gè)重要方向”。
IDC產(chǎn)業(yè)本身隨著大模型商用進(jìn)程可能也將面臨變化。
張炳華對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析,目前大型AI模型尚未迎來(lái)大規(guī)模商業(yè)化階段,因此現(xiàn)階段AI訓(xùn)練的需求高于AI推理需求。預(yù)計(jì)約在2~3年后,AI推理需求將會(huì)顯著增長(zhǎng)。
他指出,未來(lái)商業(yè)模式和應(yīng)用場(chǎng)景都可能發(fā)生變化,特別是在接近用戶(hù)端,推理的需求將會(huì)大幅增長(zhǎng),因此,要根據(jù)業(yè)務(wù)場(chǎng)景、客戶(hù)需求和政策因素等條件對(duì)數(shù)據(jù)中心進(jìn)行規(guī)劃和建設(shè)。
“未來(lái)的運(yùn)維工作也將面臨更多挑戰(zhàn)。傳統(tǒng)的風(fēng)冷數(shù)據(jù)中心運(yùn)維相對(duì)簡(jiǎn)單,但隨著智能計(jì)算規(guī)模的擴(kuò)大,數(shù)據(jù)中心的機(jī)柜功率密度、冷卻方式和供電方案等方面都在不斷演進(jìn)。”他補(bǔ)充道。
多方位競(jìng)速
新的競(jìng)爭(zhēng)趨勢(shì)正在擴(kuò)圍,信通院指出,為響應(yīng)國(guó)家政策號(hào)召,第三方數(shù)據(jù)中心服務(wù)商正積極轉(zhuǎn)變發(fā)展策略,調(diào)整業(yè)務(wù)布局,深耕西部地區(qū)算力服務(wù)市場(chǎng)的同時(shí),更積極拓展東南亞及“一帶一路”共建國(guó)家等海外市場(chǎng)。
然而,跨區(qū)域部署乃至跨國(guó)部署的環(huán)境挑戰(zhàn)重重,特別是在當(dāng)前全球算力資源供給日益緊張的背景下。面對(duì)這些挑戰(zhàn),企業(yè)仍需謹(jǐn)慎部署、靈活應(yīng)對(duì)。
張炳華對(duì)記者表示,秦淮數(shù)據(jù)集團(tuán)在數(shù)據(jù)中心業(yè)務(wù)選址中形成了“能源流”“數(shù)據(jù)流”和“業(yè)務(wù)流”三流合一的原則,已分別在張家口和慶陽(yáng)等“東數(shù)西算”樞紐節(jié)點(diǎn)落地部署。
從算力跨區(qū)域布局角度,面對(duì)目前還較難解決的傳輸過(guò)程中網(wǎng)絡(luò)時(shí)延問(wèn)題,他提出,新型AI的計(jì)算過(guò)程主要分為模型訓(xùn)練(離線計(jì)算)和在線推理兩種類(lèi)型。由于西部地區(qū)土地廣袤且電價(jià)低廉,可考慮將東部產(chǎn)生的熱數(shù)據(jù)輸送到西部地區(qū)用于大模型的離線計(jì)算和訓(xùn)練;與此同時(shí),靠近業(yè)務(wù)核心的東部區(qū)域數(shù)據(jù)中心則專(zhuān)注于在線推理任務(wù),從而有效規(guī)避網(wǎng)絡(luò)時(shí)延帶來(lái)的數(shù)據(jù)傳輸問(wèn)題。
此外,進(jìn)一步推動(dòng)“東數(shù)西算”工程需要從多個(gè)層面突破,包括但不限于直連網(wǎng)絡(luò)建設(shè)、建立跨區(qū)域算力結(jié)算與交易機(jī)制、加強(qiáng)節(jié)點(diǎn)間過(guò)渡性橋梁建設(shè)、推動(dòng)“源網(wǎng)荷儲(chǔ)”一體化項(xiàng)目建設(shè),以及持續(xù)優(yōu)化算力基礎(chǔ)設(shè)施服務(wù)等。
面對(duì)目前芯片短缺和性能問(wèn)題,張炳華指出,可以通過(guò)擴(kuò)大集群布局規(guī)模來(lái)改善,包括增加GPU卡數(shù)量和網(wǎng)絡(luò)優(yōu)化等手段,盡管這種方式對(duì)研發(fā)尖端大模型助力有限,但對(duì)開(kāi)發(fā)垂域模型卻能發(fā)揮積極作用。
普洛斯數(shù)據(jù)中心相關(guān)負(fù)責(zé)人則對(duì)記者表示,實(shí)現(xiàn)“東數(shù)西算”的根基是優(yōu)秀的算力平臺(tái),算力平臺(tái)的基石是數(shù)據(jù)中心運(yùn)管平臺(tái),算力平臺(tái)的底層邏輯是對(duì)算力資源的分配、調(diào)度、削峰填谷,在能效、業(yè)務(wù)、用戶(hù)、性能等多維度中尋優(yōu)。數(shù)據(jù)中心管理平臺(tái)就是為算力平臺(tái)提供能效、基礎(chǔ)設(shè)施資源的最優(yōu)管理。在算力平臺(tái)調(diào)度過(guò)程中,需要追蹤基礎(chǔ)設(shè)施的容量變化,通過(guò)建立專(zhuān)家、AI等技術(shù)手段動(dòng)態(tài)調(diào)整基礎(chǔ)設(shè)施的運(yùn)行策略,從而支撐算力平臺(tái)的快速調(diào)度。
不止于國(guó)內(nèi)市場(chǎng),第三方數(shù)據(jù)中心服務(wù)商也在積極出海,東南亞、“一帶一路”共建國(guó)家均是投資熱門(mén)地區(qū)。例如萬(wàn)國(guó)數(shù)據(jù)在東南亞、韓國(guó)等地區(qū)規(guī)劃部署了大型數(shù)據(jù)中心業(yè)務(wù);世紀(jì)互聯(lián)2022年積極參與新加坡數(shù)據(jù)中心容量申請(qǐng)等。
在海外市場(chǎng),秦淮數(shù)據(jù)集團(tuán)已在馬來(lái)西亞、印度、泰國(guó)有所布局,在印度尼西亞也有資源儲(chǔ)備。據(jù)悉,公司已成功應(yīng)用并推廣大規(guī)模全預(yù)制數(shù)據(jù)中心技術(shù),通過(guò)海外建筑鋼結(jié)構(gòu)建造+國(guó)內(nèi)機(jī)電工廠預(yù)制的建造模式,全面實(shí)現(xiàn)了海外項(xiàng)目快速、高效、高質(zhì)全預(yù)制交付模式。以馬來(lái)西亞MY06項(xiàng)目四期為例,僅用時(shí)8個(gè)月就實(shí)現(xiàn)了從打樁、建設(shè)、測(cè)試到圓滿(mǎn)交付業(yè)務(wù)。
張炳華告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,秦淮數(shù)據(jù)集團(tuán)正積極探索海外市場(chǎng)的新發(fā)展模式,如進(jìn)一步探索能力輸出,包括產(chǎn)品研發(fā)能力、方案設(shè)計(jì)能力、工程交付能力及運(yùn)營(yíng)保障能力等,以期在全球范圍內(nèi)實(shí)現(xiàn)更大的拓展和影響。
當(dāng)然,挑戰(zhàn)也在出現(xiàn),不少?lài)?guó)家都對(duì)綠色、能耗等提出了更多要求。王珅對(duì)記者表示,“肯定會(huì)面臨更大的各方面壓力,當(dāng)然是遲早要面對(duì)的。那么不如盡早經(jīng)歷、學(xué)習(xí)和應(yīng)對(duì),同時(shí)也幫助國(guó)內(nèi)數(shù)據(jù)中心企業(yè)進(jìn)步。策略上可以首先以中資企業(yè)或‘一帶一路’共建國(guó)家投資等為主,逐漸真正地進(jìn)入第三方的主要競(jìng)爭(zhēng)場(chǎng)地中?!?