中國(guó)儲(chǔ)能網(wǎng)訊:UCloud(優(yōu)刻得科技股份有限公司)是中國(guó)知名的中立云計(jì)算服務(wù)商,其兩大云基地分別位于“東數(shù)西算”工程規(guī)劃的國(guó)家算力樞紐節(jié)點(diǎn),內(nèi)蒙古(烏蘭察布)和長(zhǎng)三角(上海青浦)。
“其實(shí)我們布局烏蘭察布數(shù)據(jù)中心時(shí),‘東數(shù)西算’8個(gè)樞紐節(jié)點(diǎn)還未發(fā)布。當(dāng)時(shí)考慮烏蘭察布離北京近,海拔更高,有電價(jià)低廉、自然低溫等優(yōu)勢(shì),能耗控制較好;上海數(shù)據(jù)中心則位于長(zhǎng)三角一體化等多個(gè)國(guó)家戰(zhàn)略交匯點(diǎn),適合布局核心計(jì)算業(yè)務(wù)、高時(shí)效業(yè)務(wù)。”UCloud副總裁劉杰告訴《瞭望東方周刊》。
“兩個(gè)基地各有優(yōu)勢(shì)。比如,人工智能企業(yè)可以構(gòu)建混合云,將模型訓(xùn)練等非實(shí)時(shí)計(jì)算部署在烏蘭察布,將需要實(shí)時(shí)計(jì)算的推理工作部署在上海,降低成本的同時(shí)提高創(chuàng)新效率?!眲⒔苷f(shuō)。
“縱觀當(dāng)下中國(guó)整體算力分布,東部算力規(guī)模仍遠(yuǎn)高于中西部地區(qū),但依然無(wú)法滿(mǎn)足日益增長(zhǎng)的算力需求?!鄙虾I缈圃盒畔⒀芯克彼L(zhǎng)丁波濤告訴《瞭望東方周刊》,“東部地區(qū)不僅有科學(xué)計(jì)算和大數(shù)據(jù)處理的需求,還有增長(zhǎng)更快的人工智能訓(xùn)練和推理計(jì)算等需求,這些都需要體量更大的多種類(lèi)型智能計(jì)算。隨著‘東數(shù)西算’工程推進(jìn),未來(lái)我國(guó)將逐步形成東、中、西部更加均衡分布的算力體系?!?
“東算”熱數(shù)據(jù)
在過(guò)去一年里,各地紛紛通過(guò)出臺(tái)政策、活動(dòng)招商、建設(shè)重點(diǎn)項(xiàng)目等,響應(yīng)國(guó)家“東數(shù)西算”戰(zhàn)略,加快推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)和升級(jí)。
作為全國(guó)信息化發(fā)展的“排頭兵”,上海具有領(lǐng)先的產(chǎn)業(yè)發(fā)展優(yōu)勢(shì)和積極的地方政策。2022年6月,上海市通信管理局印發(fā)的《新型數(shù)據(jù)中心“算力浦江”行動(dòng)計(jì)劃(2022-2024年)》明確,力爭(zhēng)到2024年初步建成全國(guó)一體化算力網(wǎng)絡(luò)上海樞紐節(jié)點(diǎn),形成與本市數(shù)字經(jīng)濟(jì)發(fā)展方式相適應(yīng),長(zhǎng)三角地區(qū)協(xié)同發(fā)展的算力服務(wù)發(fā)展格局,建成具有亞太乃至全球影響力的高能級(jí)算力樞紐中心。
2022年1月,江蘇省工業(yè)和信息化廳印發(fā)《江蘇省新型數(shù)據(jù)中心統(tǒng)籌發(fā)展實(shí)施意見(jiàn)》,提出到2023年底,江蘇省數(shù)據(jù)中心機(jī)架規(guī)模年均增速保持在20%左右,平均利用率提升到65%,全省新型數(shù)據(jù)中心比例不低于30%,高性能算力占比達(dá)10%,新建大型及以上數(shù)據(jù)中心電能利用效率(PUE)降低到1.3以下;到2025年底,江蘇省數(shù)據(jù)中心機(jī)架規(guī)模達(dá)70萬(wàn)標(biāo)準(zhǔn)機(jī)架,新型數(shù)據(jù)中心占比進(jìn)一步提升,算力算效水平顯著提高。
數(shù)字經(jīng)濟(jì)大省浙江也于2021年發(fā)布《浙江省推動(dòng)數(shù)據(jù)中心能效提升行動(dòng)方案(2021-2025年)》,提出到“十四五”期末,浙江省數(shù)據(jù)中心平均PUE下降至1.5以下,其中大型以上數(shù)據(jù)中心 PUE 降至1.3以下,長(zhǎng)三角樞紐區(qū)集群內(nèi)數(shù)據(jù)中心PUE達(dá)到1.25以下,全省數(shù)據(jù)中心可再生能源使用率達(dá)到30%以上。
2022年6月23日,之江實(shí)驗(yàn)室計(jì)算與數(shù)據(jù)中心,工程師們通過(guò)“之江云”系統(tǒng)監(jiān)測(cè)服務(wù)器集群的運(yùn)行狀態(tài)(黃宗治/攝)
在算力基礎(chǔ)設(shè)施方面,據(jù)浙江省經(jīng)濟(jì)和信息化廳統(tǒng)計(jì)數(shù)據(jù),截至2023年2月底,全省已建成數(shù)據(jù)中心150多個(gè),主要布局在杭州、嘉興、湖州、金華、溫州等地。算力規(guī)模達(dá)8.86EFlops,已用算力規(guī)模5.07EFlops,另有在建算力規(guī)模7.48EFlops。
2022年7月,首屆中國(guó)算力大會(huì)在山東濟(jì)南舉辦。在這場(chǎng)我國(guó)算力領(lǐng)域首個(gè)全國(guó)性會(huì)議上,現(xiàn)場(chǎng)簽約啟動(dòng)項(xiàng)目總投資額約461億元,涉及中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信、中國(guó)鐵塔、中國(guó)廣電、華為、阿里、浪潮等算力龍頭企業(yè)。業(yè)內(nèi)人士梳理這些項(xiàng)目發(fā)現(xiàn),“東數(shù)西算”已成為這些項(xiàng)目決策和落地的重要依據(jù)。一年多時(shí)間來(lái),多家行業(yè)龍頭在8大樞紐和10大集群積極布局,申請(qǐng)土地空間和能耗指標(biāo),推動(dòng)自身算力基礎(chǔ)設(shè)施建設(shè)。
自2022年2月之后一年間,全國(guó)新開(kāi)工建設(shè)的數(shù)據(jù)中心項(xiàng)目中,以長(zhǎng)三角樞紐及其內(nèi)長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)集群、蕪湖集群承建項(xiàng)目數(shù)量最多,西部樞紐中則以成渝樞紐及其內(nèi)的天府集群、重慶集群為首。
“當(dāng)前,大部分算力需求集中在數(shù)字經(jīng)濟(jì)發(fā)展較發(fā)達(dá)的東部沿海地區(qū)?!倍〔治?,即使在“東數(shù)西算”政策引導(dǎo)之下,許多企業(yè)簽約落地項(xiàng)目的地區(qū)仍首選東部地區(qū),算力業(yè)務(wù)向西遷移的增量還是集中在成渝等準(zhǔn)一線城市,部分互聯(lián)網(wǎng)巨頭和三大運(yùn)營(yíng)商已經(jīng)在貴州、寧夏等西部地區(qū)率先有了進(jìn)一步的探索。
“目前,西部地區(qū)項(xiàng)目主要承載的是對(duì)網(wǎng)絡(luò)依賴(lài)不強(qiáng)的冷數(shù)據(jù)處理需求和備份需求等業(yè)務(wù),真正意義的‘西算’市場(chǎng)還需要加大培育力度?!敝袊?guó)科學(xué)院計(jì)算技術(shù)研究所研究員、中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專(zhuān)委會(huì)秘書(shū)長(zhǎng)張?jiān)迫嬖V《瞭望東方周刊》。
一卡難求
2022年底,美國(guó)OpenAI推出的ChatGPT引爆了國(guó)內(nèi)市場(chǎng)對(duì)于大模型的熱情,大模型本身對(duì)GPU算力有極強(qiáng)的需求。“目前,國(guó)內(nèi)能提供對(duì)應(yīng)算力支持的超算中心還不多,國(guó)家超級(jí)計(jì)算濟(jì)南中心(以下簡(jiǎn)稱(chēng)“濟(jì)南超算中心”)的神器——山河超算平臺(tái)部署的智能計(jì)算集群能夠提供人工智能計(jì)算能力?!睆?jiān)迫榻B。
“在大模型熱潮襲來(lái)后,不少?lài)?guó)內(nèi)企業(yè)找過(guò)來(lái),希望能夠使用山河的人工智能算力訓(xùn)練大模型。”國(guó)家超級(jí)計(jì)算濟(jì)南中心研究員郭猛告訴《瞭望東方周刊》,“目前不少科研機(jī)構(gòu)、高校、互聯(lián)網(wǎng)公司排隊(duì)已經(jīng)很長(zhǎng)時(shí)間,簡(jiǎn)直‘一卡難求’?!?
“這個(gè)‘卡’主要是說(shuō)目前人工智能大模型訓(xùn)練最常用的專(zhuān)業(yè)級(jí)顯卡?!惫驼f(shuō)。
濟(jì)南超算中心是我國(guó)完全采用自主處理器研制的千萬(wàn)億次超級(jí)計(jì)算機(jī)神威·藍(lán)光的誕生地,也是我國(guó)超算領(lǐng)域的“領(lǐng)頭羊”之一。
2019年,借助新建全球首個(gè)以“超算”為主題的科技園——國(guó)家超級(jí)計(jì)算濟(jì)南中心科技園的契機(jī),濟(jì)南超算中心謀定建設(shè)山河超算平臺(tái)。這個(gè)平臺(tái)不僅可以提供傳統(tǒng)高性能計(jì)算算力,還能提供云計(jì)算和智能計(jì)算服務(wù),后兩者將滿(mǎn)足更多民生、產(chǎn)業(yè)領(lǐng)域的算力需求。
“全球的超算都在沖速度,尤其是高性能計(jì)算在不斷追求更快、更強(qiáng),如何讓超算的算力得到更好的利用?讓超算機(jī)構(gòu)更好地運(yùn)轉(zhuǎn)?”濟(jì)南超算中心副主任郭瑩說(shuō),“超算研制瞄準(zhǔn)的是解決大問(wèn)題,比如‘超算諾貝爾獎(jiǎng)’戈登貝爾獎(jiǎng)獲獎(jiǎng)的那些案例,但這些大問(wèn)題可能占比不到20%,真正消耗大量算力的還是大批量的中小規(guī)模應(yīng)用,所以我們的超算要同時(shí)滿(mǎn)足這兩類(lèi)需求?!?
在服務(wù)更多產(chǎn)業(yè)和企業(yè)的背景下,山河超算平臺(tái)應(yīng)運(yùn)而生。2021年建成的山河平臺(tái)高性能計(jì)算能力達(dá)80PFlops (每秒千萬(wàn)億次計(jì)算),人工智能計(jì)算能力達(dá)到1000PFlops,整體性能居世界先進(jìn)水平,在德國(guó)漢堡舉行的ISC2022高性能計(jì)算大會(huì)上,一舉登頂世界最新IO500榜單,且大幅刷新了該榜單歷史最好成績(jī)。
“山河平臺(tái)建成后,我們服務(wù)的用戶(hù)面越來(lái)越廣,對(duì)接的需求也越來(lái)越多元,圍繞山河平臺(tái)正在形成一個(gè)越來(lái)越豐富的超算應(yīng)用生態(tài)。”郭猛說(shuō)。
“由于選對(duì)了技術(shù)路線,濟(jì)南超算中心發(fā)展勢(shì)頭迅猛?!睆?jiān)迫u(píng)價(jià)。
為了進(jìn)一步挖掘算力底座的潛力。圍繞濟(jì)南超算中心,濟(jì)南市歷城區(qū)規(guī)劃打造了14.2平方公里的超算數(shù)字經(jīng)濟(jì)生態(tài)創(chuàng)新圈。2022年底,濟(jì)南超算中心和濟(jì)南超算數(shù)字經(jīng)濟(jì)創(chuàng)新圈服務(wù)中心等機(jī)構(gòu)以聯(lián)合招商小組的名義向全球發(fā)布招商。
“這不是一次單純的招商,更重要的是我們想讓大家都知道濟(jì)南有一個(gè)超算中心,我們的算力能賦能你的產(chǎn)業(yè)?!睗?jì)南超算中心副主任、濟(jì)南超算技術(shù)研究院院長(zhǎng)潘景山說(shuō)。
“算力對(duì)企業(yè)的重要性和吸引力不斷增長(zhǎng),越來(lái)越多的企業(yè)來(lái)科技園考察,越來(lái)越多的企業(yè)家在琢磨怎么能用上這種算力。”潘景山說(shuō),“一些企業(yè)因?yàn)槌阒行亩x擇落地濟(jì)南超算數(shù)字經(jīng)濟(jì)生態(tài)創(chuàng)新圈?!卑凑找?guī)劃,到2025年,這一創(chuàng)新圈將集聚50家龍頭企業(yè),引進(jìn)和培育企業(yè)500家,新增就業(yè)崗位5000個(gè),形成千億級(jí)數(shù)字經(jīng)濟(jì)集群。
AI公共算力平臺(tái)
新藥研發(fā)中的分子篩選、智能網(wǎng)聯(lián)汽車(chē)的車(chē)路協(xié)同、無(wú)人值守的“黑燈工廠”……這些對(duì)算力有大量剛需的產(chǎn)業(yè)場(chǎng)景,過(guò)去不得不面對(duì)排隊(duì)申請(qǐng)算力的無(wú)奈。
2023年2月20日,依托上海超算中心建設(shè)及運(yùn)用的上海市人工智能公共算力服務(wù)平臺(tái)正式揭牌啟用。以該平臺(tái)為核心,上?!?+N”算網(wǎng)體系初步形成。
“上海超算中心屬于政府公共算力服務(wù)平臺(tái),通過(guò)對(duì)公共算力和各種商業(yè)算力的集聚調(diào)度,努力實(shí)現(xiàn)算力如水電等基礎(chǔ)設(shè)施一樣便利使用,為科研機(jī)構(gòu)和廣大中小企業(yè)提供具有公信力的普惠算力,幫助企業(yè)降低使用算力的成本,實(shí)現(xiàn)異構(gòu)異地資源共享?!鄙虾3阒行木C合管理部部長(zhǎng)林薇告訴《瞭望東方周刊》。
據(jù)介紹,新建平臺(tái)是采用國(guó)產(chǎn)自研達(dá)芬奇架構(gòu)的人工智能算力平臺(tái),計(jì)算峰值能力(FP16)達(dá)到100PFlops。主要器件CPU和AI處理器采用冷板式液冷,輔助設(shè)備通過(guò)風(fēng)液換熱器進(jìn)行間接冷卻,能耗PUE低于1.3。目前,三大運(yùn)營(yíng)商以及商湯、華為、騰訊等智算中心的算力都在踴躍加盟這一算力調(diào)度平臺(tái)。
“當(dāng)然,要實(shí)現(xiàn)算力抱團(tuán)也面臨不小的挑戰(zhàn)?,F(xiàn)在各種算力的技術(shù)標(biāo)準(zhǔn)、接入方式等都不盡相同,如何通過(guò)平臺(tái)將這些算力資源匯聚起來(lái),進(jìn)行統(tǒng)一調(diào)度,需要研究相應(yīng)的策略和方法。”林薇說(shuō)。
根據(jù)中國(guó)信通院發(fā)布的《中國(guó)綜合算力指數(shù)(2022年)》,截至2021年底,上海市算力指數(shù)排名位列全國(guó)第一,綜合算力指數(shù)排名位列全國(guó)第二。報(bào)告顯示,上海市算力、存力、運(yùn)力發(fā)展水平均處于全國(guó)前列。從算力規(guī)模來(lái)看,截至2021年底,上海市在用算力規(guī)模超過(guò)13EFlops,在建算力規(guī)模超過(guò)7EFlops。
在上海,集成電路、生物醫(yī)藥、人工智能三大先導(dǎo)產(chǎn)業(yè),數(shù)字經(jīng)濟(jì)、綠色低碳、元宇宙、智能終端四大新賽道,以及前瞻布局的未來(lái)健康、未來(lái)智能、未來(lái)能源、未來(lái)空間、未來(lái)材料等五大未來(lái)產(chǎn)業(yè),無(wú)不是算力需求大戶(hù)。
“比如,一名神經(jīng)系統(tǒng)疾病患者的檢查和治療數(shù)據(jù)高達(dá)500G,急重癥患者每天產(chǎn)生的用藥、化驗(yàn)數(shù)據(jù)等,都迫切需要充沛算力輔助?!比A山醫(yī)院神經(jīng)外科副主任醫(yī)師、教授孫一睿說(shuō),“現(xiàn)在,由上海超算中心提供公共服務(wù)算力支撐,華為提供自主可控的昇騰芯片及MindSpore昇思人工智能技術(shù)框架,上海聯(lián)通提供算網(wǎng)一體技術(shù)、聯(lián)通云和算力集成運(yùn)營(yíng)服務(wù),多方共同打造上海公共服務(wù)算力孵化人工智能輔助醫(yī)學(xué)的創(chuàng)新應(yīng)用,有力推動(dòng)醫(yī)療系統(tǒng)數(shù)智化升級(jí)?!?
“不過(guò),即便上海有這樣的算力基礎(chǔ),由于全社會(huì)對(duì)于數(shù)字資源的存儲(chǔ)、計(jì)算和應(yīng)用需求與日俱增,導(dǎo)致算力仍供不應(yīng)求?!倍〔f(shuō)。
未來(lái)必選項(xiàng)
隨著“雙碳”目標(biāo)提出和全社會(huì)數(shù)字化轉(zhuǎn)型的加速,數(shù)據(jù)中心作為海量數(shù)據(jù)的主要存儲(chǔ)與運(yùn)算處理實(shí)體,其規(guī)模不斷擴(kuò)大,由此帶來(lái)的能源消耗問(wèn)題受到廣泛關(guān)注。
據(jù)中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所測(cè)算,到2030年,我國(guó)數(shù)據(jù)中心耗電量將超過(guò)3800億千瓦時(shí),如果不采用可再生能源,碳排放量將超過(guò)2億噸,算力基礎(chǔ)設(shè)施的綠色低碳亟待實(shí)現(xiàn)。
為此,國(guó)家及各地政府相繼出臺(tái)多項(xiàng)政策性文件,對(duì)電能利用效率(PUE值)指標(biāo)控制呈現(xiàn)嚴(yán)格趨勢(shì),在數(shù)據(jù)中心建設(shè)項(xiàng)目審批、運(yùn)營(yíng)管理、差別電價(jià)等方面不斷將PUE值作為剛性指標(biāo)。
根據(jù)工信部《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)》發(fā)布的數(shù)據(jù),到2023年底,全國(guó)數(shù)據(jù)中心機(jī)架規(guī)模年均增速保持在20%左右,平均利用率力爭(zhēng)提升到60%以上。
同時(shí),在國(guó)內(nèi)多地出臺(tái)清退落后產(chǎn)能的相關(guān)政策文件中,一些東部地區(qū)的數(shù)據(jù)中心也赫然在列。廣東省提出,珠三角地區(qū)60%中高時(shí)延數(shù)據(jù)業(yè)務(wù)遷至粵東粵西粵北地區(qū);浙江省提出,對(duì)于省內(nèi)數(shù)據(jù)中心整體上架率(建成投用1年以上)低于50%的運(yùn)營(yíng)單位,不支持新建大型和超大型數(shù)據(jù)中心項(xiàng)目,對(duì)已建數(shù)據(jù)中心“整合一批、改造一批、淘汰一批”;北京市出臺(tái)《低效數(shù)據(jù)中心綜合治理工作方案》,對(duì)低效數(shù)據(jù)中心,分批開(kāi)展整治工作,有序遷移關(guān)閉。
“淘汰一部分東部數(shù)據(jù)中心、把一部分算力轉(zhuǎn)移到西部,本質(zhì)上都是基于實(shí)現(xiàn)‘雙碳’目標(biāo)的考慮,‘東數(shù)西算’不僅能夠節(jié)約‘西電東送’的成本,還能提高對(duì)西部光伏、風(fēng)電等綠色能源的使用?!倍〔f(shuō)。
“UCloud幫助客戶(hù)將原本部署在東部的服務(wù)器中對(duì)時(shí)延敏感性低的業(yè)務(wù)西遷至烏蘭察布數(shù)據(jù)中心,遷移后可以幫助客戶(hù)將IT運(yùn)營(yíng)成本降低50%。” 劉杰說(shuō)。
“我們公司的主營(yíng)業(yè)務(wù)是云計(jì)算。云計(jì)算本身就是一種綠色的計(jì)算資源,通過(guò)集群化管理、高效運(yùn)營(yíng),相對(duì)于傳統(tǒng)架構(gòu),降低能源消耗和資源消耗;烏蘭察布數(shù)據(jù)中心選址可以助力新能源消納,同時(shí)降低數(shù)據(jù)中心的PUE和耗電量;上海青浦云計(jì)算中心建設(shè)光伏發(fā)電,抵消自身碳排放。” UCloud基礎(chǔ)設(shè)施工程管理經(jīng)理?xiàng)钍鐚毟嬖V《瞭望東方周刊》。
“同時(shí),我們的數(shù)據(jù)中心還利用很多創(chuàng)新性技術(shù)手段,諸如自然冷卻、間接蒸發(fā)、熱回收、高壓直流、智能化運(yùn)營(yíng)等,降低數(shù)據(jù)中心PUE,降低能耗和碳排放。比如在上海數(shù)據(jù)中心采用的白露間接蒸發(fā)冷卻技術(shù),通過(guò)重構(gòu)間接蒸發(fā)冷卻流程,極大地提高了制冷效率?!睏钍鐚氀a(bǔ)充道,這項(xiàng)技術(shù)獲得了2022年“云計(jì)算中心科技獎(jiǎng)卓越獎(jiǎng)”。
“‘東數(shù)西算’工程剛啟動(dòng)一年多,相關(guān)規(guī)劃和基礎(chǔ)設(shè)施目前還在推進(jìn)過(guò)程中。對(duì)于企業(yè)來(lái)說(shuō),‘東數(shù)’要不要‘西算’,目前看來(lái)是可選項(xiàng),未來(lái)可能是必選項(xiàng)?!倍〔f(shuō)。