中國儲能網訊:隨著人工智能的發(fā)展,算力基礎設施加速迭代。近日,中國證券報記者跟隨中國電信舉辦的2024年投資者反向路演活動,走進中國電信臨港智算谷。
這里是長三角規(guī)模最大的運營商級算力資源池,也是國內首個正式投入運營的國產單池萬卡液冷算力集群。目前,中國電信臨港智算谷一期正在向10萬卡的智算集群規(guī)模有序推進,終期規(guī)劃為30萬卡的高端智算集群。
“兩彈一優(yōu)”高標準示范
走進中國電信臨港智算谷一期A4機房,上千臺服務器“黑壓壓”整齊排列,在冷板式液冷等技術助力之下,實現了極致高密互聯部署。
相比風冷,冷板式液冷散熱方式更高效。記者明顯感受到了機柜艙門內外的溫差。據介紹,智算中心的平均PUE值達到國家新建數據中心1.25的標準,部分區(qū)域更是低至1.08。
智算谷相關負責人介紹,這里是全國首個國產液冷萬卡集群,能夠為人工智能大模型訓練、推理等工作提供強大的基礎設施支撐。
業(yè)內人士表示,構建萬卡智算集群,僅GPU的采購成本就高達幾十億元。擁有萬卡資源并不等于構建了萬卡集群,多元異構的GPU芯片,對智算集群的系統(tǒng)管理提出了更高、更復雜的要求。
例如,為應對智算算力在供電、散熱方面的挑戰(zhàn),智算谷創(chuàng)新采用“兩彈一優(yōu)”(即彈性供電、彈性制冷、氣流組織優(yōu)化)的方式,實現了隨需應變的彈性能力。
數字信息基礎設施持續(xù)演進升級,以滿足人工智能發(fā)展需求。中國電信規(guī)劃并建設全國“2+3+7+X”公共智算云池,在京津冀、長三角建設國內領先的萬卡全液冷智算集群,在廣東、江蘇等5省打造千卡資源池,滿足AI訓練、推理需求。截至上半年末,中國電信智算總規(guī)模達到21EFLOPS,算力總規(guī)模持續(xù)領先。
中國電信堅持“兩彈一優(yōu)”,積極推進數據中心向AIDC升級。針對智能算力異構和分散化等問題,中國電信率先提出基于長距無損智算網,構建分布式智算集群,突破單體智算中心的算力、空間、供電等資源限制。
算力集群將進一步擴容
中國電信臨港智算谷是上海臨港算力產業(yè)版圖中的重要部分,可為臨港乃至整個上海數字經濟發(fā)展提供強大支撐。
據了解,上海臨港新片區(qū)已經形成8個高能級智算中心,批復的機架數超4.15萬個,已建成的機架數超2.35萬個。按照臨港新片區(qū)的規(guī)劃,未來將進一步擴容算力集群,力爭2025年算力產業(yè)總體規(guī)模提升至100億元。
智算谷項目一期占地119畝,規(guī)劃建設10萬卡高端智算集群,2023年9月1.1期投產,2024年9月1.2期兩棟機樓成功封頂,具備機電進入條件。
未來,中國電信將持續(xù)構建高質量算力供給體系,以綠色低碳、超大規(guī)模、超高性能算力底座,推動開放、共贏、可持續(xù)的AI產業(yè)生態(tài)發(fā)展,打造具有國際影響力的人工智能產業(yè)生態(tài)集聚區(qū)。