SPS的全称是 Standby PowerSuply,翻译过来就是后备电源的意思,其实不是完全意义上的电池,电池的英文应该是battery,这个理解有点复杂,如果不理解就当电池好了。主要作用是给SP就是控制器供电,如果机器突然掉电,这个SPS还可以继续提供电力300秒的时间,这段时间内存中的数据就会写到磁盘中,避免内存中的数据丢失。
SPS支持两种,1200W和2200W的电池,下面是1U 1200W SPS的示意图。2U的SPS是2200W,一般VMAX和DMX都使用2200W的电池,但部分VNX也可以使用2200W的电池。
在什么情况下使用2U的SPS?
当使用4U 60块磁盘扩展柜的DAE作为Vault drive的时候,并且Vault drive 是Flash磁盘的时候,使用2U 的SPS,其他情况使用1U的SPS就可以了。而且是Block和File一起的unified架构。
SPS监控线2U和1U的是不同的
2U SPS (RJ-12) port 是一个LAN port,不是WAN port。LAN ports 含有安全的超低电压 (SELV) 集成电路。而WAN port 是 telephone-network voltage (TNV) circuits.
注意,RJ-45 (or TNV-type) 外观和 RJ-12 很相似,区别在于:
- RJ-45 is an 8-wire modular jack. The RJ-12 is a six-wire modular jack.
- RJ-45 plugs and jacks are wider than their RJ-12 counterparts - 7/16" vs 3/8".
- RJ-45 plug won't fit into an R-J12 jack. But an RJ-12 plug will fit into an RJ-45 jack.
这个图片是RJ-12的port
Micro DB-9到RJ12的线,PN为 038-003-085,这个监控线是从SP就是控制器到1U SPS的。遇到过很多情况,就是没有插这个线或者插反了,这样系统中就认不到电池SPS存在。
更换SPS的过程其实是很简单的,仔细看看结构,就知道了,拧开前面的螺丝,然后从后面往前推就抽出来了。
经常遇到的问题是SPS更换以后,系统的故障灯还继续亮着,在图形界面上继续显示Fault或者not ready等,如下图所示:
如果还有其他问题,可以 wechat 和我们进一步探讨 wechat: StorageExpert。
从naviseccli -getcurs 可以看到sps的状态是 cabling status is unknow
C:\> naviseccli -h (sp-ipaddress) getcrus
SPE5 Enclosure SPE *FAULT*
(Enclosure SPE : Faulted; Enclosure SPE SPS A : Faulted)
SP A State: Present
SP B State: Present
Enclosure SPE Power A0 State: Present
Enclosure SPE Power A1 State: Present
Enclosure SPE Power B0 State: Present
Enclosure SPE Power B1 State: Present
Enclosure SPE SPS A State: Present
Enclosure SPE SPS B State: Empty
Enclosure SPE SPS A Cabling State: Cabling Status is unknown
Enclosure SPE SPS B Cabling State: Cabling Status is unknown
如果电池的LED灯是绿色,Ktcons中的sps是OK状态。 这个VNX或者CX的OE bug。该问题在下面的版本中解决:
VNX1代的05.32.00005.217
- Release 29 的 Release 29, Release 28.707, Release 26.031 patch, and Release 23.707
- 超过这个版本 R29 p012; R30 p526; and R32 p216
排除了cable和电池的问题,下面是临时解决办法:
1. 重启两个控制器的management server,中间相隔5分钟以上。这个不影响业务。
1)通过setup界面重启
2)命令行重启
Naviseccli -h SPA address networkadmin -restartcimom
Naviseccli -h SPB address networkadmin -restartcimom
不要使用K10governor 来重启managemnt server, 这个有宕机隐患。
过几分钟,到unispere上查看sps的状态是否更新。
2. 重启对端的控制器,注意这里的重启是physical的重启,不是soft的重启(management modle是是sp的一部分,不能拆开的型号)。
- 关闭write cache
- 运行 shutdownpeersp的命令
- 如果sp已经shutdown了,把sps的电源关掉。把sp物理上抽出来。
- 过几分钟,sps加电,然后插入sp
- 重新打开write cache
3. 对于部分vnx,如果有单独的management module,就不需要重启sp了
- 把management module 拔下来
- sps断电,等几分钟,sps完全断电
- 然后重新给sps加电
- 把management module插进去
- 等几分钟,sps完全充电以后,查看unisphere的状态。
也有情况听客户讲,重启对端SP不起作用,需要把2个控制器都分别重启,但这个我没有见过,也不是很合理,估计什么地方操作有不当的地方。