當(dāng)?shù)貢r(shí)間2019年4月15日下午6點(diǎn)50分左右,法國(guó)巴黎圣母院發(fā)生火災(zāi),整座建筑損毀嚴(yán)重。著火位置位于圣母院頂部塔樓,大火迅速將圣母院塔樓的尖頂吞噬,很快,尖頂如被攔腰折斷一般倒下。
火災(zāi)發(fā)生后,巴黎市檢察機(jī)關(guān)在第一時(shí)間宣布啟動(dòng)調(diào)查,調(diào)查方向初步定為“意外”引發(fā)火災(zāi),檢方已經(jīng)排除了縱火的可能性,也不認(rèn)為此事和恐怖主義有關(guān)。
巴黎圣母院的大火引發(fā)了國(guó)人的關(guān)心和聯(lián)想。咸豐十年(1860年)英法聯(lián)軍攻占北京后,縱火焚燒圓明園,大火三日不滅,圓明園及附近的清漪園、靜明園、靜宜園、暢春園及海淀鎮(zhèn)均被燒成一片廢墟,安佑宮中,近300名太監(jiān)、宮女、工匠葬身火海。使這座世界名園化為一片廢墟。大火連燒3天3夜,成為世界文明史上罕見(jiàn)的暴行。圓明園文物被掠奪的數(shù)量粗略統(tǒng)計(jì)約有150萬(wàn)件,上至中國(guó)先秦時(shí)期的青銅禮器,下至唐、宋、元、明、清歷代的名人書(shū)畫(huà)和各種奇珍異寶。
殖民者的暴行永世不忘,被掠奪的文物必將歸還。更重要的是我們要從巴黎圣母院的大火警示中,查找安防工作中的漏洞,杜絕“意外”事件的發(fā)生。我國(guó)的很多古跡景點(diǎn)紛紛動(dòng)作起來(lái),加強(qiáng)了安防和培訓(xùn)。
數(shù)據(jù)中心應(yīng)該怎樣杜絕“意外”事故呢?在數(shù)據(jù)機(jī)房發(fā)生的各類(lèi)事故中,火災(zāi)事故約占80%左右。主要包括電子計(jì)算機(jī)本身起火;配套設(shè)備或附屬裝置起火;空調(diào)設(shè)備或電氣設(shè)備起火;外來(lái)火災(zāi)侵?jǐn)_和雷擊等。
2014年,三星韓國(guó)果川數(shù)據(jù)中心發(fā)生火災(zāi),起火的是三星的韓國(guó)果川數(shù)據(jù)中心的四樓,火勢(shì)蔓延速度較快,很快波及建筑物頂端,室外管道可能是引發(fā)火災(zāi)的主要原因?;馂?zāi)造成了數(shù)據(jù)中心數(shù)小時(shí)的停電,從而影響了全球用戶(hù)的網(wǎng)絡(luò)服務(wù),甚至三星官網(wǎng)也出現(xiàn)了短暫的無(wú)法訪(fǎng)問(wèn)。
2017年4月4日19時(shí)57分,北郵數(shù)據(jù)中心發(fā)生火災(zāi),起火原因系UPS蓄電池組事故,事故致部分教育網(wǎng)節(jié)點(diǎn)和校園網(wǎng)暫時(shí)不能訪(fǎng)問(wèn)。
2018年9月30日上午10點(diǎn)26分,青島西海岸惠普大數(shù)據(jù)中心發(fā)生火災(zāi);
2015年10月13日,Windows Azure上海數(shù)據(jù)中心發(fā)生故障,是由服務(wù)器所在機(jī)房著火斷電引起,導(dǎo)致Azure基礎(chǔ)設(shè)施離線(xiàn)無(wú)法提供正常服務(wù),受影響的用戶(hù)包括金融、互聯(lián)網(wǎng)、房地產(chǎn);2015年5月26日早晨,遠(yuǎn)在美國(guó)亞利桑那州平頂山的蘋(píng)果工廠(chǎng)發(fā)生火災(zāi),起火點(diǎn)位于該公司數(shù)據(jù)處理中心屋頂光伏項(xiàng)目;2015年1月10日亞馬遜公司正在美國(guó)弗吉尼亞州建設(shè)的一座數(shù)據(jù)中心發(fā)生火災(zāi);2014年7月20日重慶農(nóng)商行數(shù)據(jù)中心發(fā)生重大火災(zāi),整個(gè)機(jī)房全部燒毀,直接損失達(dá)到一個(gè)億以上。
僅僅幾年,數(shù)據(jù)中心的火災(zāi)事故頻發(fā)。對(duì)于數(shù)據(jù)中心發(fā)生的故障,行業(yè)專(zhuān)家認(rèn)為故障多發(fā)的原因還是在運(yùn)維管理上,正所謂“三分技術(shù),七分管理”,數(shù)據(jù)中心的故障大多源自于人禍。筆者認(rèn)為很多人(包括許多專(zhuān)家)將“意外”發(fā)生的根源歸罪于運(yùn)維和運(yùn)維管理人員,其實(shí)這是非常不公平的。
正像可靠性源于設(shè)計(jì)一樣,數(shù)據(jù)中心的連續(xù)運(yùn)行的安全性同樣也是源自設(shè)計(jì),這就給設(shè)計(jì)院的設(shè)計(jì)工作提出了更加嚴(yán)格的要求。
在數(shù)據(jù)中心的消防設(shè)計(jì)時(shí),必須選擇安全、環(huán)保、效果好的滅火產(chǎn)品,要考慮滅火產(chǎn)品的安全環(huán)保性、經(jīng)濟(jì)合理性、產(chǎn)品的適用性、可調(diào)整性等綜合性能;還必須搜集滅火產(chǎn)品在國(guó)際、國(guó)內(nèi)應(yīng)用的廣泛性及在大型項(xiàng)目中的業(yè)績(jī);在國(guó)際、國(guó)內(nèi)獲得的產(chǎn)品的認(rèn)可及認(rèn)證系統(tǒng)設(shè)計(jì)的配套工具,如系統(tǒng)設(shè)計(jì)計(jì)算的軟件等。
在數(shù)據(jù)中心施工建設(shè)時(shí),必須嚴(yán)格遵守施工規(guī)范,GB50462-2015《中心基礎(chǔ)設(shè)施施工及驗(yàn)收規(guī)范》是必須遵照的國(guó)家標(biāo)準(zhǔn)。特別是不能留有隱蔽性隱患。
數(shù)據(jù)中心的綜合布線(xiàn)對(duì)數(shù)據(jù)中心建設(shè)來(lái)說(shuō)尤為重要。選擇什么樣的線(xiàn)纜、線(xiàn)經(jīng)和布線(xiàn)方案,對(duì)設(shè)備安全運(yùn)行、維護(hù)和升級(jí)改造都會(huì)有很大影響。
數(shù)據(jù)中心設(shè)備的布局,如機(jī)柜正確的擺放方式應(yīng)該是將服務(wù)器機(jī)柜面對(duì)面或者背靠背的擺放,這樣便形成了冷通道和熱通道,機(jī)柜之間的冷熱風(fēng)不會(huì)混合在一起,形成短路氣流,大大提高制冷效果,保護(hù)好冷熱通道不被破壞。
高功率負(fù)載和高密度的服務(wù)器集中擺放,容易導(dǎo)致數(shù)據(jù)中心的局部熱點(diǎn)和單路電源功耗過(guò)高問(wèn)題,可以將這些高功率設(shè)備和高密度服務(wù)器分在每個(gè)機(jī)柜內(nèi),這樣就不會(huì)出現(xiàn)高功率密度設(shè)備群。這對(duì)避免局部溫度升高,從而引發(fā)數(shù)據(jù)中心故障是有益的。
當(dāng)然,數(shù)據(jù)中心機(jī)房運(yùn)維管理工作責(zé)任重大,隨著互聯(lián)網(wǎng)、信息化產(chǎn)業(yè)的不斷發(fā)展,作為各種信息載體的數(shù)據(jù)中心發(fā)揮著越來(lái)越重要的作用,因此數(shù)據(jù)中心的安全運(yùn)行變得尤為關(guān)鍵,數(shù)據(jù)中心運(yùn)維管理工作也變得越來(lái)越復(fù)雜。
驗(yàn)證測(cè)試是一個(gè)確保數(shù)據(jù)中心各系統(tǒng)設(shè)計(jì)、安裝、功能測(cè)試、系統(tǒng)聯(lián)調(diào)、運(yùn)行狀態(tài)與設(shè)計(jì)意圖相符合的過(guò)程,是實(shí)施獲得良好功能和可靠運(yùn)行過(guò)程中的重要組成部分。一個(gè)好的驗(yàn)證測(cè)試不僅滿(mǎn)足測(cè)試相關(guān)的設(shè)備功能指標(biāo),更重要的是驗(yàn)證系統(tǒng)是否可以滿(mǎn)足運(yùn)行階段的要求。對(duì)系統(tǒng)運(yùn)維人員而言,在驗(yàn)證測(cè)試的過(guò)程,可以驗(yàn)證設(shè)備操作流程,增加實(shí)際操作和應(yīng)對(duì)突發(fā)事件的經(jīng)驗(yàn)。近幾年建設(shè)的數(shù)據(jù)中心,都要求在數(shù)據(jù)中心投產(chǎn)前必須進(jìn)行驗(yàn)證測(cè)試。
數(shù)據(jù)中心基礎(chǔ)設(shè)施的驗(yàn)證
測(cè)試是業(yè)主對(duì)于數(shù)據(jù)中心建設(shè)質(zhì)量進(jìn)行檢驗(yàn)的一個(gè)重要過(guò)程,正式投產(chǎn)前未進(jìn)行驗(yàn)證測(cè)試,將給數(shù)據(jù)中心后續(xù)運(yùn)行帶來(lái)巨大的風(fēng)險(xiǎn)隱患。驗(yàn)證測(cè)試同樣也適用于改擴(kuò)建和日常的運(yùn)維項(xiàng)目,通過(guò)儀表測(cè)量、觀察、分析等方式,找出系統(tǒng)運(yùn)行的潛在風(fēng)險(xiǎn),實(shí)行相應(yīng)的改善措施,確?;A(chǔ)設(shè)施達(dá)到功能要求,實(shí)現(xiàn)預(yù)期的可靠性和可利用性。
如下圖所示,主要的驗(yàn)證測(cè)試包括性能驗(yàn)證測(cè)試、功能驗(yàn)證測(cè)試和運(yùn)維驗(yàn)證測(cè)試。
巴黎圣母院的大火給數(shù)據(jù)中心建設(shè)和安全運(yùn)行敲響了警鐘,一切“意外”的隱患必須從數(shù)據(jù)中心設(shè)計(jì)階段給予重視,不能把故障的主要責(zé)任推給運(yùn)維和運(yùn)維人員。希望設(shè)計(jì)院的設(shè)計(jì)師們多為數(shù)據(jù)中心的連續(xù)性安全運(yùn)行和運(yùn)維人員著想,下苦功夫,從大處著眼,從小處著手,設(shè)計(jì)出一個(gè)經(jīng)得起“意外”事故考驗(yàn)的數(shù)據(jù)中心。
作者簡(jiǎn)介
曲學(xué)基:中國(guó)空間技術(shù)研究院高級(jí)工程師,《UPS應(yīng)用》雜志主編。