鉅大LARGE | 點擊量:1460次 | 2020年08月28日
數據中心機房UPS電源故障的處理辦法
1、突然掉電
故障原因:UpS過載
雙電源固然好,但假如UpS壞了,設備照樣可能斷電,因為由布線圖可以看出,它們是串聯的。有一次,UpS電源中斷輸出,指示燈全不亮了,信息中心機房的所有設備全部停止運行,網絡隨即全部癱瘓??偨浝碛H自打電話到機房,要求以最快的速度恢復正常。
突然掉電會造成機器硬件很大的損傷,還對公司運營出現影響。慶幸的是,當時管理員都在上班。為了盡快恢復設備運行,我們首先試著重新啟動UpS,居然啟動成功并正常運行了。但是伴有不間斷的鳴叫聲,于是查看UpS維護說明,對應找到此類蜂鳴表示的故障原因——UpS過載。
大家很快想起在不久前剛新增一臺功率500W左右的服務器,可能是它使得UpS負載超出警戒上限,最后導致自動停機保護。那為何超載了,又沒有蜂鳴報警呢?原來有人無意識地關閉了蜂鳴,沒有考慮到它已經超負荷,反正能供電就把蜂鳴當作誤報處理給關了。
根據分析出的原因,我們立刻停運了幾臺不重要的設備,讓UpS的負載指示率低于90%,UpS又開始安靜地工作了??磥硎褂肬pS也要量力而行,我們下一步就只能新增UpS容量來解決問題。
2、UpS意外跳轉
故障原因:地線干擾
一次市電正常,大家都能正常上網,可UpS總是跳轉到電池組供電模式。在此模式下,蜂鳴總是不斷地鳴叫提示。我們馬上組織人員檢查電路,分析故障原因。最后和機房的立式空調聯系起來了,每次啟動空調不一會,就自動轉為電池組供電。顯然這是市電輸出受到大功率空調機影響所致。但是他們是分開兩路單獨供電的,是從不同的配電室里面的配電盤接來的,怎么會出現互相干擾呢?
帶著這樣的疑問,電工就順著電線打開天花板、地板、接線盒等逐點進行排查??词遣皇鞘裁吹胤诫娐诽摻拥揭黄鹆?,最后發現它們的零線和地線接到了一塊。如此模糊的干擾,對UpS的影響都能被體現到,果然是個精密設備,不能有一點的含糊。
我們決定對空調的地線進行分開處理。分開零線和地線后,再啟動空調,發現沒有再出現UpS跳轉電池組的情況。那么以前怎么沒有表現出來呢?我們分析認為是2007年夏天太熱了,空調滿負荷運轉,加大了功率消耗。
電源的質量對公司網絡能否穩定、安全至關重要。但網絡電源安全實際上還有很多屬性,如高性能、可擴展性、可靠性、功能性、準確性和可用性等。為了使公司網絡電源能持續穩定地運行下去,除了平常的規范使用外,周期性地利用各種測試工具,對網絡電源環境執行維護測試也是必須的。整個機房供電安全系統,要技術人員認真維護,并要做好日常排查工作,及時發現問題,分析處理非計劃停機造成的影響等。
3、雙電源跳轉失敗
故障原因:金屬生銹
我公司以前舊的機房空間狹小,屋內的配套設施不完備,導致問題百出,給正常的業務辦理帶來很多麻煩,其中的供電系統就是維護重點。在公司季度停電檢修中,雙電源自動轉換開關在正常的轉換中失敗了,沒有能自動跳轉,靜靜地一點反應也沒有。同時,備用的電源就沒有起到應有用途,UpS上的市電顯示燈沒有輸入電顯示。
看到這種情況,部門所有的人員都齊聚來查找故障原因。我們斷開電源,使用工具打開轉換開關,發現里面所有的接觸開關上的金屬觸點都生銹了,金屬生銹導致自動跳轉失靈。幸運的是,開關絕緣做得不錯,沒有發生短路。我們估計生銹有兩個原因:長時間沒有使用該功能,化工公司環境條件比較差。經過一番清理除銹工作,我們重新安裝好了開關,然后手動轉換恢復供電。
經過這件事情,我們總結的相關經驗是,雙電源轉換開關一定要有專人維護,定期查看組件損壞情況,及時更新。值得注意的是,由于轉換開關上面的接線比較多、比較緊湊,拆卸和使用的時候一定要小心謹慎。我們就曾經經歷一次雙電源開關損壞的情況。當時是在一次機房改造搬遷中,舊的開關在拆卸時因用力過猛而導致里面固定座脫落,跳轉功能喪失,最后只能更換一個新的。
雙電源自動轉換開關具有過載、短路等保護功能。當電源出現故障時,轉換開關能自動完成常用電源到備用電源的轉換,以保證機房的持續供電,這是第一層保護。當然,前提是這個常備電源必須是從不同原點接入的。
從電源的最適宜環境的角度考慮,較低溫度下可以有較高相對濕度,在周圍空氣溫度為+40℃時機房的空氣相對濕度不宜超過50%。同時,假如該月的平均最低溫度為+25℃,就要考慮到因溫度變化在設備表面上發生的凝露。當常用電源下降至有效值的70%以下或常用電源其中一相或者三相電壓中斷時,常用電源延時切換至備用電源,并在常用電源恢復正常時,又將備用電源延時切換至常用電源。這樣就給輸入UpS的電源一個安全屏障,減少設備的停運次數。
做一個細心的、有熱情的人,照管好自己的設備,這就是維護工程師的成就。
1、UpS溫度控制維護
在UpS的構成中除了冷卻用的風扇和斷路器開關部件外,還有大量的固態電子器件。它們基本上不存在機械磨損,因此能夠長期地工作在最佳運行狀態之中。假如要及時發現可能出現的故障苗頭,并防止故障隱患擴大,就要使UpS工作在適宜的環境中,并做好日常維護。UpS的工作環境應該與計算機的工作環境相同,溫度應控制在5℃以上,22℃以下;相對濕度控制在50%以下,上下幅度不超過10%。當然,和這些因素同樣重要的是應保持UpS工作間的清潔、無灰塵、無污染、無有害氣體,因為這些因素同樣影響UpS的使用壽命和引發故障。
在UpS的日常維護工作中,工程師要每日進行例行檢查,其重要目的是為了積累UpS電源的運行相關經驗和及時發現故障苗頭,因此每日的例行檢查都要細心。
2、有效接地防雷擊
為了保護建筑物內的電子電器設備不被靜電雷擊所損壞,電源布線時必須連接地線。要清醒地認識到,電源無地線是十分危險的。設備外殼接地要獨立引線接到室外,并且保證系統符合對接地電阻的要求,防靜電可以安裝永久性防靜電地板,要使用防靜電手套等防靜電產品,在操作設備時必須要戴上機柜上準備的防靜電套腕,每天用濕拖把拖地板1至2次;操作設備前洗手等措施。
建筑物的防雷器只是保護建筑物不被直擊雷損壞,而不能保護建筑物內部的電子電器設備免遭感應雷損壞。
雷擊通過電源電纜或通信線路進入到建筑物內部的機會較大。在這種情況下,感應電壓的峰值將對建筑物內部的“敏感電子設備”造成破壞。建筑物內部的計算機或者敏感電子設備還要有自己的“二級保護”;如包括安裝適合的浪涌保護設備。
下一篇:EPS應急電源維修注意事項匯總