數(shù)據(jù)中心電源是設(shè)計和運行數(shù)據(jù)中心的基本要素。一次簡單的電源故障可能是一場大災(zāi)難,造成嚴重影響,尤其是隨著越來越多的公司轉(zhuǎn)向托管服務(wù)和云解決方案,數(shù)據(jù)中心的數(shù)量正在飆升。一個可靠的供配電系統(tǒng)是保持數(shù)據(jù)中心的高效和安全,并將經(jīng)濟損失降到最低的必要條件。這篇文章是為那些想了解數(shù)據(jù)中心的電力系統(tǒng)、電力故障的原因以及應(yīng)對方法的你準備的。
供配電系統(tǒng)是數(shù)據(jù)中心最多的子系統(tǒng)之一。通過不同的設(shè)備,系統(tǒng)可以根據(jù)數(shù)據(jù)中心的大小和規(guī)模而變化。
確定數(shù)據(jù)中心的可靠性有一個四級等級系統(tǒng),從一級到四級。Tier I 通常用于小型企業(yè),而 Tier IV 數(shù)據(jù)中心通常用于提供額外發(fā)電機組以實現(xiàn)冗余的企業(yè)。下圖將以Tier IV數(shù)據(jù)中心的簡化圖示為例,展示數(shù)據(jù)中心內(nèi)的電源系統(tǒng)。
圖 1:數(shù)據(jù)中心的電力系統(tǒng)
通常,來自電力設(shè)施的功率可能非常高。有一個變壓器通過自動轉(zhuǎn)換開關(guān) (ATS) 將高壓降低到安全水平。由于電力供應(yīng)商無法保證隨時隨地的完美供電,且無法冗余接入公用電網(wǎng),因此數(shù)據(jù)中心至少連接一臺柴油或燃氣備用發(fā)電機,為支持的服務(wù)器或服務(wù)器提供備用電源。其他數(shù)據(jù)中心設(shè)備。一旦電源中斷,轉(zhuǎn)換開關(guān)將向備用發(fā)電機發(fā)出信號以啟動,以便為數(shù)據(jù)中心設(shè)備提供發(fā)電。
但是,從啟動發(fā)電機到提供全功率需要一點時間。不間斷電源(UPS)作為備用電源起到彌合時間差距的作用。想了解更多關(guān)于UPS的詳細信息,可以參考什么是不間斷電源或UPS。通常有一個維護旁路面板 (MBP),使 UPS 可以運行到維護旁路模式,并在系統(tǒng)斷電進行維修時實現(xiàn)無負載中斷。最終,電源將連接到配電單元 (PDU),配電單元連接到一系列遠程配電盤 (RPP)。然后將不同的機架 PDU 插入 RPP 的不同插座盒中,作為冗余電源鏈的一部分。這就是供電系統(tǒng)的工作原理。
數(shù)據(jù)中心的電力系統(tǒng)故障可能以系統(tǒng)停止、數(shù)據(jù)丟失、變壓器發(fā)熱、損壞停機或其他任何形式發(fā)生。這些現(xiàn)象會引發(fā)一系列前所未有的事件,從而導致數(shù)據(jù)中心的巨大損失。那么供配電系統(tǒng)怎么會出現(xiàn)停電呢?既有雷電天氣或硬件故障等自然因素,也有人為災(zāi)害,其中人為因素占停電原因的很大一部分。此處列出了導致數(shù)據(jù)中心電源故障的一些常見人為因素。
在設(shè)計數(shù)據(jù)中心的過程中,數(shù)據(jù)中心功率容量的估計不準確。它可以走向兩個極端:電力容量未充分利用或需求超過電力供應(yīng)。高估容量可能會導致容量未被使用,這意味著數(shù)據(jù)中心將用其整個生命周期來支持設(shè)備的過高安裝成本和維護。而低估所需的電力容量可能會在耗電 IT 設(shè)備和電力消耗增長時導致電力中斷。
動力設(shè)備選擇不當與上述估算因素有關(guān)。為了跟上不斷增長的業(yè)務(wù),許多數(shù)據(jù)中心正在部署越來越多的高密度服務(wù)器,這促使配電系統(tǒng)接近峰值容量。當?shù)凸阑蚋吖离娏ω摵蓵r,電壓值不合適的電力設(shè)備將影響數(shù)據(jù)中心的正常運行。例如,UPS 的電源電壓值與服務(wù)器的電源電壓值不匹配會導致過載并導致 UPS 剝離。另一方面,有時客戶會被一些電力設(shè)備廠商的廣告所誤導,而忽略了對可靠性的實際檢驗。質(zhì)量問題或最大性能指標不準確都會影響配電系統(tǒng)。
不合理的電力系統(tǒng)設(shè)計和建設(shè)有其隱患,可能引發(fā)隱患。如果設(shè)計將多個電源設(shè)備連接到電源線中的一個點,則可能會因負載過大而導致電源故障。例如,如果只有單個 PDU 連接多個大功率組件,一旦單個 PDU 發(fā)生故障,數(shù)據(jù)中心電源系統(tǒng)將停止運行。布線不良也可能使系統(tǒng)出現(xiàn)故障。如果電纜長度不符合保持設(shè)備正常性能的要求或布局混亂,則可能導致過熱導致系統(tǒng)關(guān)閉。
電力系統(tǒng)的可靠性對數(shù)據(jù)中心來說非常重要,那么如何保證優(yōu)質(zhì)的電力呢?以下是一些關(guān)于防止數(shù)據(jù)中心電力系統(tǒng)故障的建議。
這通常是設(shè)計數(shù)據(jù)中心時首先要問的問題之一:“數(shù)據(jù)中心在預期壽命期間的功率容量是多少?” 通常,典型數(shù)據(jù)中心設(shè)施的生命周期將跨越幾代 IT 設(shè)備。做好數(shù)據(jù)中心容量規(guī)劃,使IT設(shè)備的電力需求與電力設(shè)備的容量保持一致,對數(shù)據(jù)中心的有效性至關(guān)重要。評估當前電力容量的第一步是了解 IT 設(shè)備、冷卻系統(tǒng)、照明和關(guān)鍵電力負載的電力需求。隨著大功率設(shè)備越來越多地被采用,平均功耗也在上升。管理人員應(yīng)該為 IT 設(shè)備機架提供越來越多的數(shù)據(jù)中心電源容量,這就是我們看到部署越來越多機架 PDU 的原因。
在準確評估了數(shù)據(jù)中心的電力容量需求之后,就到了為數(shù)據(jù)中心配備合適設(shè)備的過程。合適的電源系統(tǒng)可以最大限度地降低電源故障的風險。雙電源組件,如雙PDU,建議支持冗余。此外,必須考慮 IT 設(shè)備產(chǎn)生的諧波電流。可以應(yīng)用隔離變壓器來減輕諧波電流的影響。
電力設(shè)備和IT設(shè)備的日常物理檢查是確保所有系統(tǒng)處于良好工作狀態(tài)的必要過程。例如,UPS 和電池的定期維護對于最大程度地減少停電問題的可能性至關(guān)重要。確定基礎(chǔ)設(shè)施的變化,以免遺漏一些對整個系統(tǒng)產(chǎn)生重大影響的細節(jié),減少電能使用量,延長設(shè)備壽命,從而避免人工成本和更換設(shè)備的成本。
確保您的數(shù)據(jù)中心擁有強大的電力系統(tǒng)對于促進業(yè)務(wù)的平穩(wěn)運行至關(guān)重要。一些數(shù)據(jù)中心電力系統(tǒng)的問題可以通過采取以上一些措施得到控制。因此,重要的是對電力系統(tǒng)進行有效的準備,盡可能降低風險,從而提高競爭力并為企業(yè)獲得更多利潤。