摘要:核心机房UPS为重要负载供电,不容忽视。文章介绍了UPS输出负载短的后果及解决方案;结合案例说明中要重视零线的检查;UPS零地电压产生的原因及解决方案;UPS蓄电池安装,需要注意的问题;UPS电容爆炸的原因及解决方案,并分析了电容爆炸几种不同现象的原因。
核心机房UPS为计费系统、IDC设备、重要金融用户设备、网管终端等重要负载供电,一旦出现事故影响很大。近年来,各运营商都出现过因UPS导致的系统瘫痪事故。笔者经多年的工作实践总结了减少核心机房UPS事故需要注意的几个问题。
UPS输出负载短百分之九十以上会导致UPS系统出现输出停电或闪断故障,从而导致所接的重要设备瘫痪。UPS输出负载短时,不管单机、主从、并机,还是双母线系统都不能负载不断电。以目前最安全可靠的UPS并机双母线冗余供电系统为例,如图1。
图1 UPS并机双母线带并机柜并机提供双母线通过并机柜并机构成系统一,UPS2-1和UPS2-2通过并机柜并机构成系统二。正常情况下,系统一与系统二分别带自己的负载。
系统一经UPS1输出柜和静态转换开关STS1带负载,系统二经UPS2输出柜和静态转换开关STS2带负载,STS1设定1优先导通,STS2设定为2优先导通。当其中一个系统供电母线上的任何设备故障时,其负载可经静态转换开关切换至另一个系统供电。
为了两套系统可以同频率、同相位,还可以通过负载总线同步控制器切换时电源在波形和相位上是连续的。对多数故障,这种系统都没有问题,但还是不能解决输出负载短问题。这是因为短相当于过载,切换到系统2,系统2也会过载宕机,导致负载断电。
实际工作中发生输出短的可能性其实很大。现在很多运营商核心机房的UPS系统是并机方式,2台UPS并机通过一个UPS配电柜/配电箱给机房内所有的数据、网管、计费设备供电。从这个主UPS配电柜到各负载还有可能经过若干个配电柜、配电箱、插座。其中任何一个环节出现短故障,都有可能导致全系统断电。另外不同运营商,不同地市,各专业之间的界面不尽相同。有的是所有电源都由动力专业;有的是UPS主配电柜以外归其它专业,UPS主配电柜及以内归动力专业。其它专业在动力技能方面可能有欠缺,存在很多不确定性,有发生短的可能。UPS都是优先自身设备,不同厂家设计不同,输出短时有的UPS不转旁,直接关掉逆变器宕机;有的转旁,但会顶掉空开,造成小面积停电。笔者遇到过一次,两台30kVAUPS并机,安装调试时由于施工人员操作不慎,设备端的UPS输出配电柜母排短,两台UPS逆变器都停止工作,也没有转旁,只有断开再关闭市电输入开关,重新开机才恢复正常。
目前,设备制造厂商已将多数重要的网络通信设备制作成具有双电源输入特性的设备。有2个交流电源接口,可以接2交流电,内部再通过2个交流/直流转换模块转换成直流电,并联给设备供电,如图2。
但实际工作中,一般只用了1个交流电源接口,或者最多用一根导线并接到第二个电源接口。这样只解决了交流/直流转换模块的冗余,对电源线意外断开或是输出短则为力。为了最大限度地发挥双电源输入设备的技术潜力,避免UPS输出短导致系统宕机,重要设备供电安全,最好的解决办法是用两套双母线并机系统,分别给重要设备的2个电源端口供电。这样既解决了电缆冗余,又解决了输出短问题,虽然建设成本高了一些,但安全性大大提高,对重要设备还是值得的。
一个无人值守关口局在某写字楼八楼,一楼营业厅从八楼关口局交流配电柜引电,UPS也从交流配电柜引电,UPS输出到一个UPS配电箱再给一些计费、网管等设备供电。故障现象是冬季UPS连续几天晚上12点左右断电,UPS显示“输出短”,负载掉电,到现场重起UPS后恢复正常。最后发现是以下2个原因:一是一楼营业厅门卫晚上用几个单相电暖器,并且接到了同一相交流电上,导致三相不平衡,由于零线电流是三相电流的矢量和,不平衡导致零线电流过大。
从主交流配电柜测零线电流,白天很正常,晚上用电暖器时测约20A。二是UPS配电箱的零线排上几个设备的零线螺丝松动。零线虚接再加上零线电流过大导致打火,UPS判断为“输出短”从而宕机。紧固零线,拆除电暖器后故障排除。所以在中要特别注意零线的检查,从UPS输出到用电负载的整个供电径上的零线都要定期检查紧固。
当UPS的负载不对称,或UPS带有非线性负载时,中性线中就会有电流流过,在中性线上产生压降引起中线和地线之间的电压差通常称为“零地电压”。中性线电流越大、负载距离越远、中性线导线截面越小,则“零地电压”就越大。有些灵敏负载对“零地电压”要求很高,例如“零地电压”大于1V,有些服务器就不能正常工作。
这是因为一般核心机房接地系统都是UPS输出中性线和负载中性线固定接到市电电源的中性线上,市电电源的中性线在低压进线柜中连接到接地极上,UPS输出和负载的中性线与市电的中性线没有任何的隔离。核心机房中交流电缆很多,每一根电缆都含有大量的电磁干扰,所有的这些电缆被捆扎在一起走长线,使得这些高频干扰互相串扰,高频干扰电流在零线、地线上流过带来了零地之间的压降。
解决的办法一是将UPS的火线和零线、地线分开走线,两者的距离应该在20cm以上,其它动力电缆也远离UPS零线。如果施工现场条件不允许,零线和地线要用铠装屏蔽电缆。但这种方标不治本,机房内设备变化,电磁干扰也随之改变,零地电压也会改变,不能彻底解决问题。二是在UPS负载端加隔离变压器,并将隔离后的零线接地,可以负载的零地电压趋近于零,解决“零地电压”问题效果最好。
UPS蓄电池是一个容易出问题的环节,由UPS蓄电池引发的事故占UPS总事故较大比重。这是因为UPS蓄电池一般是12V蓄电池,内部实际上是6只2V蓄电池焊接构成,制作难度大,而且板栅,连接条比较薄,只要一个板栅出现问题,整只UPS电池就有问题,故障率远远高于2V蓄电池,所以在安装中要注意以下几个问题。
(1)UPS蓄电池最好用蓄电池架安装,不要用蓄电池柜。一是便于通风散热,UPS蓄电池对温度非常,最佳温度是20~25℃,温度每升高10℃,蓄电池的寿命就会降低一倍。UPS蓄电池充放电过程中会大量热能,热量散不出去,直接影响电池容量与寿命。二是便于测量。用蓄电池柜安装,如果空间太小,巡检时操作人员可能会因为操作不便,或视线问题导致操作工具短或检查不仔细忽略本应发现的故障隐患。有这样一个案例:主从热备份UPS系统,密封蓄电池柜(有通风孔),螺丝固定的面板拆卸不便,用螺丝刀拆才能打开。一次巡检发现备机UPS的蓄电池组中底层角落里有两只蓄电池连接线松动,并且漏液。UPS蓄电池是大电流放电,这种情况下如果恰好主机UPS故障,备机UPS蓄电池放电供给负载,后果严重,有可能着火甚至爆炸。
(2)UPS蓄电池连接线不要用开口铜鼻子,要用孔型铜鼻子,开口铜鼻子不如孔型压接牢固,容易脱落;连接线要用软铜线,不要用硬铜线,硬铜线有时由于吃着劲,当时紧固了,时间长了会松动,造成端子处连接不良,在一定的条件下可能端子处拉弧或热量*,最终导致着火;连接线要用长度一致的同一规格导线,否则电阻不一致,长期使用,会发生充电时有的UPS蓄电池已充满,有的UPS蓄电池还没充满,从而导致已充满的UPS蓄电池过充,水分从安全阀溢出,电解液浓度变大,长时间会腐蚀极板,导致蓄电池一致性变差。
(3)由于蓄电池很重,安装时要用正确的方法搬运和吊装蓄电池,不能用钩子或螺丝刀直接勾住蓄电池外露极柱搬卸蓄电池。极柱与极板是焊接的,这样会拉伤蓄电池端子,严重时可能导致着火。另外蓄电池组上输出的电缆,不要直接从电池端子拉至主设备,中间需要有接线盒或转接端子,否则蓄电池端子上长期承受拉力,可能蓄电池内部的连接。
UPS的电容一般是指其内部的直流滤波电容和储能电容及输入输出交流滤波电容。UPS电容爆炸一般是指直流滤波电容和储能电容,它通常选用容量较大的电解电容,电容爆炸一般是因为耐压问题造成的,其本质原因有如下二个。
(1)电容本身质量问题。近年来,一些厂家为了降低产品售价,提高产品中标的竞争力,选用了寿命较短的直流滤波电容,这也是导致目前发生电容爆炸故障的事例日益增多的主要原因。
(2)温度。电容器的使用寿命随温度的增加而减小,温度加速介质与电解液化学反应使介质随时间退化,耐压值下降。另外温高还会导致漏电流增大。在直流正向电压于电容器一段时间后仍有一个微小电流持续从正电极流向负电极,这个微小的电流即称为漏电流。漏电流越小表明电介质制作得越精良,漏电流的特性是随着温度的升高越来越大。为防止电解液蒸发,电容一般采用密封结构,散热性较差。如果热量不能及时排出去,器件内部温度上升会很快,导致漏电流的进一步增大;根据电流热效应,漏电流增大又会导致温度上升,热量积累恶性循环,使电容内部电解液沸腾和汽化,气压迅速增大到外壳无法承受时,就会爆炸。如果防护设计的不好,电解液喷溅到电板上,检测控制电受损还会导致更加严重的后果。
电容温度高的原因一是机房较差,长期不造成UPS内部积尘过多,散热不良。二是空调送/回风通道设计不好,UPS周围温度较高。解决的方法为每年对UPS做一次内部除尘;做好空调设计,避免局部高温;采用远红外成像仪、远红外测温仪等检测仪对滤波电容的异常温升进行检测,及时更换有潜在故障隐患的电容,防患于未然。
UPS内部的储能直流电容耐压值一般为直流450~500V,以POWERWARE9150/930510kVAUPS为例,其内部直流母线VDC,而直流电解电容的耐压值是450VDC。UPS中的相控整流器控制着输出直流电压的高低,UPS使用年限越长,相控整流器电器件参数越老化,造成UPS内部的直流400V电压不再稳定。市电波动时,会造成UPS内部400V直流电压波动,波动的电压幅值很可能会超过450V,造成直流电解电容过压,再加上电容长期使用耐压性能下降,就会发生爆裂。解决的方法是选用大品牌UPS设备,把好产品质量关;到达报废年限的UPS报废(一般UPS寿命是5~7年,5年报废);使用超过3年的UPS要定期检查内部的电容,看看有没有漏液、鼓包,容量是不是已经下降到其容量误差下限等,这些是爆炸的。
理论上,并机系统中一台UPS故障,故障UPS应自动退出系统,其它正常工作,但现实中电容爆炸时却不一定是这样。统计资料显示一旦发生电容爆炸故障,90%以上的几率会导致并机系统出现输出停电或闪断故障(中断时间大于8~20ms),从而导致负载瘫痪几十分钟甚至几小时。
(1)除了发生电容爆炸的那台UPS单机处于逆变器自动关机状态之外,其余各台UPS似乎都处于“正常的”逆变器电源供电状态。这是因为并机UPS系统中一台设备逆变器发生故障导致系统输出电压波动,或是输出交流电压中含有很高的直流成分电压,或是拉低了系统输出电压,从而影响到负载。
(2)除了发生电容爆炸的那台UPS单机处于逆变器自动关机状态,其它UPS的输入开关或UPS并机系统的总输入开关跳闸,UPS处于电池组提供能量的逆变器供电状态。这种情况主要原因是电容爆炸的UPS的逆变器发生了内部短故障,由于逆变器并联,导致其它UPS逆变器输出瞬间短,输出电流瞬间增大,而这些电流不是供给负载,而是供给内部短的UPS,从而造成正常的UPS瞬间过载,进而导致相关输入开关跳闸。
(3)“N+1”UPS并机系统中各台UPS的输入、输出配电柜中的开关都配置为断器开关。一台UPS的滤波电容爆炸,其余UPS的输入、输出开关全都跳闸。这是因为交流输入滤波电容爆炸造成市电小范围供电恶化。UPS都有输入滤波器,该滤波器都有电感线圈,输入市电在瞬时发生突变,相当于感性负载两端电压突变,从而产生反向电动势,冲击相关的断器,断器都有过压和过流功能,开关全都跳闸。
(4)并机系统中除了发生电容爆炸的那台UPS逆变器自动关机,其余UPS均处于“正常的”逆变器供电状态,负载正常工作的情况。这种侥幸情况不会超过10%,一般是交流输入电容爆炸或者直流电解电容爆炸没有影响到检测控制电。
核心机房UPS难度大,故障率高,发生事故影响大。为了减少核心机房UPS事故,需要深入分析其发生事故的各种可能原因,做好基础工作,将事故隐患消除在萌芽状态。
·维谛技术UPS安全运行10年!芯片巨头英特尔的产品选择获得高价值回报(7-20)·数以千计的运营商边缘机房,该什么样的服务器“入坑”?(6-29)·领跑5G技术4G化:浙江移动联合华为率先完成核心网5G CUPS技术应用(5-29)
·菲律宾PLDT加快网络扩展脚步:上半年部署超3900个LTE基站超2.9万公里光网8/21