限電情況下的數(shù)據(jù)中心如何確保穩(wěn)定運行
根據(jù)UptimeInstitute發(fā)布的2020年度數(shù)據(jù)中心掉線調(diào)查報告顯示,斷電在數(shù)據(jù)中心故障中的地位已經(jīng)超越人為失誤,成為第一大服務(wù)中斷原因。數(shù)據(jù)顯示,在2020年發(fā)生的數(shù)據(jù)中心故障中,大約有37%與電源有關(guān),22%與軟件、系統(tǒng)相關(guān),17%與網(wǎng)絡(luò)有關(guān),其次則為13%問題來自制冷系統(tǒng)的故障。
應(yīng)對限電要做好哪些準(zhǔn)備
一、做好基礎(chǔ)設(shè)施準(zhǔn)備
做好基礎(chǔ)保障系統(tǒng)的冗余,依舊是建設(shè)、運維數(shù)據(jù)中心的必要工作。
雙路以上的市電供電,可支持設(shè)備運行一定時間的UPS和蓄電池,可連續(xù)供電十?dāng)?shù)個小時或者更長時間的柴發(fā),或者龐大的儲能系統(tǒng),以及蓄冷裝置等……還有2N或者更多的冗余。
二、災(zāi)備演練加強(qiáng)業(yè)務(wù)存續(xù)能力
完備的硬件并不是萬無一失的保證,在日常,應(yīng)該有規(guī)律的在不影響業(yè)務(wù)環(huán)境的情況下進(jìn)行斷電測試,并且進(jìn)行業(yè)務(wù)遷移等演練,以備不時之需。
同時要加強(qiáng)對當(dāng)前系統(tǒng)的了解,數(shù)據(jù)中心的運維人員必須知道所有設(shè)備的資料,每一時刻的耗能情況。一旦斷電發(fā)生,哪些設(shè)備需要優(yōu)先供電,哪些設(shè)備應(yīng)該放棄等。每一次演練,都需要做完善的記錄,對于過程中產(chǎn)生的問題、故障,要有完善的日志和解決方案。
在斷電恢復(fù)中,設(shè)備的啟動順序,以及設(shè)備的依賴、連接情況。當(dāng)眾多設(shè)備重新加電啟動,對于供電系統(tǒng)穩(wěn)定性的影響等,都要有了解以及預(yù)案。
三、做好基礎(chǔ)設(shè)施日常維護(hù)
通過對設(shè)備的正確維護(hù)和保養(yǎng),保障機(jī)房設(shè)備穩(wěn)定、可靠、節(jié)能運行,確保通信設(shè)備的運行環(huán)境,延長設(shè)備的生命周期,降低設(shè)備的故障率。
1、數(shù)據(jù)中心基礎(chǔ)設(shè)施運維的主要任務(wù):
(1)維護(hù)機(jī)房設(shè)施,延長設(shè)備的使用周期。
(2)改造機(jī)房設(shè)施,適應(yīng)各種需求。
(3)合理運行設(shè)施,降低運營成本。
(4)保證各類運行設(shè)備設(shè)施的電氣性能、機(jī)械性能、維護(hù)技術(shù)指標(biāo)符合標(biāo)準(zhǔn)。
(5)加強(qiáng)運行設(shè)備維護(hù)管理,做好預(yù)防性維護(hù),保證設(shè)備穩(wěn)定、可靠地運行。
(6)及時排除安全隱患,防止重大安全事故的發(fā)生。
(7)完善應(yīng)急保障方案,減少故障率。
(8)積極采用新技術(shù),改進(jìn)維護(hù)方法,提高工作效率。
(9)合理調(diào)整系統(tǒng)配置,提高效率,延長各類設(shè)備使用壽命。
(10)加強(qiáng)用電管理,降低能耗,節(jié)約運行維護(hù)費用。
(11)保持設(shè)備和環(huán)境整潔。
2、電氣配電系統(tǒng)維護(hù)
▲低壓配電系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)人工倒換備用電源設(shè)備時,必須遵守有關(guān)技術(shù)規(guī)定,嚴(yán)防人為差錯。
(2)要定期試驗信號繼電器的動作和指示燈是否正常。
(3)加強(qiáng)對配電設(shè)備的巡視、檢查。主要內(nèi)容如下:
●繼電器開關(guān)的動作是否正常,接觸是否良好。
●熔斷器的溫升應(yīng)低于80℃。
●螺絲有無松動。
●智能儀表顯示是否正常。
▲發(fā)電機(jī)系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)機(jī)組應(yīng)保持清潔,無漏油、漏水、漏氣、漏電(簡稱四漏)現(xiàn)象。機(jī)組上的部件應(yīng)完好無損,接線牢靠,儀表齊全、指示準(zhǔn)確,無螺絲松動。
(2)根據(jù)各地區(qū)氣候及季節(jié)情況的變化,應(yīng)選用適當(dāng)標(biāo)號的燃油和機(jī)油。
(3)保持機(jī)油、燃油及其容器的清潔,定時清洗和更換(機(jī)油、燃油和空氣)濾清器。油機(jī)外部運轉(zhuǎn)件,要定期補(bǔ)加潤滑油。
(4)啟動電池應(yīng)經(jīng)常處于穩(wěn)壓浮充狀態(tài),每月檢查一次充電電壓及電解液液位。
(5)市電停電后應(yīng)能在15分鐘內(nèi)正常啟動并供電,需延時啟動供電的,應(yīng)報上級主管部門審批。
3、UPS系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)各種自動、告警和保護(hù)功能均應(yīng)正常。
(2)對于并聯(lián)冗余系統(tǒng)宜在穩(wěn)壓并機(jī)均分負(fù)荷的方式下運行。
(3)各地根據(jù)當(dāng)?shù)厥须婎l率的變化情況,選擇合適的跟蹤速率。對于市電頻率變化過快的地區(qū),UPS的工作方式宜采用內(nèi)同步。
4、蓄電池系統(tǒng)維護(hù)工作內(nèi)容如下:
(1)每組至少選2只標(biāo)示電池,作為了解全組工作情況的參考。
(2)不同規(guī)格、不同廠家的電池禁止在同一直流供電系統(tǒng)中使用;不同年限的電池不宜在同一直流供電系統(tǒng)中使用。
(3)密封電池在使用前不需進(jìn)行初充電,但應(yīng)進(jìn)行補(bǔ)充充電,補(bǔ)充充電方式應(yīng)按說明書規(guī)定進(jìn)行。