中國儲(chǔ)能網(wǎng)訊:阿里云位于新加坡的可用區(qū)C數(shù)據(jù)中心發(fā)生火災(zāi),導(dǎo)致包括Lazada和字節(jié)跳動(dòng)在內(nèi)的主要科技公司所托管的服務(wù)出現(xiàn)嚴(yán)重中斷。截至9月11日01:46,因消防澆水持續(xù)進(jìn)行,機(jī)房開始出現(xiàn)積水和滲漏,電路存在短路風(fēng)險(xiǎn),新加坡可用區(qū)C 一棟機(jī)房大樓整體緊急斷電,可用區(qū)C其他大樓業(yè)務(wù)網(wǎng)絡(luò)已陸續(xù)恢復(fù)。
據(jù)阿里云發(fā)布的官方聲明中事件進(jìn)展顯示:
9月10日,異常因新加坡機(jī)房鋰電池爆炸導(dǎo)致火災(zāi)及升溫,消防人員已到達(dá)現(xiàn)場處置中,云網(wǎng)絡(luò)大部分產(chǎn)品及云安全產(chǎn)品于10:55 已完成主動(dòng)切換,其他云產(chǎn)品服務(wù)仍在處理中
9月10日11:30 按照產(chǎn)品調(diào)度策略,云數(shù)據(jù)庫Redis/MongoDB/RDS MySQL、對象存儲(chǔ)OSS、表格存儲(chǔ)OTS等云產(chǎn)品的高可用版本已陸續(xù)完成容災(zāi)切換。
9月10日12:15 按照產(chǎn)品調(diào)度策略,云原生大數(shù)據(jù)計(jì)算服務(wù)MaxCompute 已完成容災(zāi)切換。
9月10日14:40 受影響機(jī)房包間的火情已經(jīng)基本得到控制,機(jī)房溫度仍高。部分OSS對象存儲(chǔ)、數(shù)據(jù)庫等產(chǎn)品的單AZ版本,需待受影響物理機(jī)柜具備重新開機(jī)條件后恢復(fù)。其余高可用版本的云產(chǎn)品均已完成主動(dòng)遷移。
9月10日20:04,目前火警仍未完全解除,受消防安全控制影響,運(yùn)維工程師無法進(jìn)入當(dāng)?shù)貦C(jī)房大樓,包間溫度持續(xù)升高風(fēng)險(xiǎn)暫無法解除。目前機(jī)房部分網(wǎng)絡(luò)設(shè)備在高溫環(huán)境下已出現(xiàn)異常,影響部分云產(chǎn)品的網(wǎng)絡(luò)互通。若后續(xù)溫升未得到有效控制,新加坡可用區(qū)C整體脫網(wǎng)的可能性在增加。若您的業(yè)務(wù)部署在新加坡可用區(qū)C,我們將協(xié)助您盡快進(jìn)行業(yè)務(wù)遷移。
9月11日01:46,接當(dāng)?shù)叵酪螅蛳罎菜掷m(xù)進(jìn)行,機(jī)房開始出現(xiàn)積水和滲漏,電路存在短路風(fēng)險(xiǎn),新加坡可用區(qū)C 一棟機(jī)房大樓整體緊急斷電,可用區(qū)C其他大樓業(yè)務(wù)網(wǎng)絡(luò)已陸續(xù)恢復(fù)。
截止到9月11日上午10:00,尚有15項(xiàng)異常提示。
目前,火災(zāi)的全面損害情況和恢復(fù)時(shí)間表尚不明確。阿里云正在努力恢復(fù)正常運(yùn)營,盡量減少對客戶的影響。
數(shù)據(jù)中心是數(shù)據(jù)存儲(chǔ)、處理的基礎(chǔ)設(shè)施,其安全性至關(guān)重要。近年來,數(shù)據(jù)中心火災(zāi)在全世界范圍內(nèi)已造成巨大的經(jīng)濟(jì)損失,嚴(yán)重威脅人身安全。
1
孟加拉國數(shù)據(jù)中心火災(zāi)導(dǎo)致3人死亡
2023年10月27日,孟加拉國首都達(dá)卡一座14層的大樓發(fā)生火災(zāi),造成3人死亡,十人受傷,該國互聯(lián)網(wǎng)服務(wù)遭到嚴(yán)重癱瘓。
據(jù)悉,這座大樓內(nèi)有多個(gè)互聯(lián)網(wǎng)網(wǎng)關(guān)、交換中心和數(shù)據(jù)中心,火災(zāi)導(dǎo)致了大量的設(shè)備和物資損毀。
據(jù)報(bào)道,孟加拉國1200萬寬帶互聯(lián)網(wǎng)用戶中約有40%在火災(zāi)期間遭遇了網(wǎng)絡(luò)中斷,而該國1.2億移動(dòng)互聯(lián)網(wǎng)用戶中約有20%在數(shù)據(jù)和語音服務(wù)方面遇到了問題。
2
韓國SK公司數(shù)據(jù)中心火災(zāi)導(dǎo)致3.2萬服務(wù)器癱瘓
2022年10月15日,韓國SK公司C&C板橋數(shù)據(jù)中心發(fā)生火災(zāi),大火在大約8小時(shí)后被撲滅。
起火后數(shù)據(jù)中心斷電造成韓國國民級聊天軟件Kakao Talk、主流電商平臺(tái)NAVER等在內(nèi)的眾多網(wǎng)絡(luò)服務(wù)中斷。據(jù)《韓國時(shí)報(bào)》報(bào)道,本次火災(zāi)導(dǎo)致了約3.2萬個(gè)服務(wù)器癱瘓,數(shù)千萬用戶服務(wù)受到影響——截止2021年,韓國人口約為5200萬。
一天之后Kakao Talk等服務(wù)才開始陸續(xù)恢復(fù)。數(shù)據(jù)中心客戶表示,由于損失了大量服務(wù)器,恢復(fù)過程比預(yù)期的要長。
調(diào)查發(fā)現(xiàn),安裝在地下三層電氣設(shè)備室的5個(gè)電池機(jī)架全部燒毀,電池和機(jī)架附近似乎因電氣因素失火。
3
Web NX美國猶他州數(shù)據(jù)中心火災(zāi)
超360萬個(gè)網(wǎng)站故障
2021年4月,美國主機(jī)托管公司W(wǎng)eb NX位于猶他州的奧格登數(shù)據(jù)中心發(fā)生火災(zāi)。
該火災(zāi)導(dǎo)致超360萬個(gè)網(wǎng)站出現(xiàn)故障,約1.5萬名客戶的資料受到影響,部分客戶數(shù)據(jù)完全丟失且無法恢復(fù)。
4
OVH數(shù)據(jù)中心火災(zāi)致使法國政府癱瘓
當(dāng)?shù)貢r(shí)間2021年3月10日,歐洲云計(jì)算巨頭OVH位于法國萊茵省首府斯特拉斯堡的數(shù)據(jù)中心發(fā)生嚴(yán)重火災(zāi),OVH在該區(qū)域擁有的4個(gè)數(shù)據(jù)中心全部暫停服務(wù)。
4座數(shù)據(jù)中心中,一座被完全燒毀,一座的服務(wù)器損毀了三分之一。
起火后,癱瘓的法國政府、企業(yè)與公共事業(yè)網(wǎng)站達(dá)到約360個(gè),一些游戲開發(fā)商在歐洲的業(yè)務(wù)也受到影響,部分位于該數(shù)據(jù)中心的服務(wù)器被燒毀,其中游戲《Rust》表示,25臺(tái)歐洲服務(wù)器完全損毀,沒有備份,數(shù)據(jù)無法被修復(fù)。
盡管OVH短時(shí)間調(diào)查后解釋,此次起火可能因UPS引起,但一年后法國官方事故調(diào)查機(jī)構(gòu)的發(fā)布的報(bào)告顯示,災(zāi)難更大可能是由電力室逆變器周圍的濕氣引起的。
5
谷歌數(shù)據(jù)中心電氣爆炸造成3人嚴(yán)重?zé)齻?/strong>
當(dāng)?shù)貢r(shí)間2022年8月8日,位于美國愛荷華州康瑟爾布拉夫斯的谷歌數(shù)據(jù)中心發(fā)生爆炸,造成3人受傷。
媒體報(bào)道,3名電工在數(shù)據(jù)中心大樓附近的變電站工作時(shí),突然發(fā)生了電弧閃光(電氣爆炸),導(dǎo)致三名電工被嚴(yán)重?zé)齻?。事故發(fā)生后,多個(gè)地區(qū)的谷歌地圖、谷歌搜索出現(xiàn)中斷服務(wù)情況,有數(shù)據(jù)顯示,該故障影響了全球40多個(gè)國家/地區(qū)的至少1338臺(tái)服務(wù)器,包括美國、澳大利亞、南非、肯尼亞、以色列、南美洲部分地區(qū)、歐洲和亞洲部分地區(qū)。
谷歌證實(shí)了這場意外為電力事故,但未披露具體原因。
數(shù)字時(shí)代,數(shù)據(jù)中心的底座作用毋庸置疑,而包括火災(zāi)在內(nèi)的事故嚴(yán)重威脅數(shù)據(jù)中心安全,將造成巨大的損失。
數(shù)據(jù)中心相關(guān)方應(yīng)加強(qiáng)協(xié)同合作,從設(shè)計(jì)、建設(shè)、運(yùn)維、監(jiān)管等方面進(jìn)行優(yōu)化發(fā)展,提高數(shù)據(jù)中心的可靠性和可恢復(fù)性,減少數(shù)據(jù)中心的事故發(fā)生率和影響范圍,為數(shù)字化、智能化的發(fā)展提供安全保證。