供电系统的模块化设计与模块化UPS
张广明 中国电源协会副理事长
摘 要
系统模块化是数据中心基础设施设计的重要理念和基本策略,数据中心设计建造中的很多问题都与系统模
块化程度有关。模块化以及与之关系紧密的标准化,为数据中心带来了广泛的好处,它不仅简化了从初始规划
到日常操作的每一个流程,还显著改进了数据中心商业价值的所有三个主要组成部分 – 可用性、适应性和总拥
有成本。 模块化UPS是可用性级别最高的模块化系统,引领着数据中心基础设施设计建造的理念和方向。
关键词:数据中心、系统模块化和标准化、模块化UPS
一、可修复和可快速修复功能是提高系统可用性的关键
现代数据中心基础设施设计和运行的一个最基本也是最重要的要求是系统必须能连续工
作。而工作连续性的程度通常是用系统的可用性来描述的。系统可用性A (t)的定义为:电子系
统在使用过程中(尤其在不间断连续使用的条件下)可以正常使用的时间与总时间之比。可用
性是由可靠性参数MTBF(平均无故障时间)和故障后平均修复时间参数MTTR表示的,
即:
MTBF
A(t)
MTBF +MTTR
可靠性MTBF愈高,系统的可用性愈高,这是不言而喻的事,但设备的可靠性是有限的,
特别是由若干不同功能不同厂家的设备组成的复杂的系统,可靠性很难达到设计要求的水平,
使数据中心基础设施特别是供电系统变得很脆弱。于是,设计者和用户很自然的想到必须从系
统的可修复和可快速修复上找出路,因为尽管系统和设备的可靠性达不到要求的高度,故障随
时都可能发生,但只要系统中的所有设备故障后都是可修复并可快速修复的,故障后平均修复
时间MTTR数值很小甚至趋近于零,那末系统的可用性同样可以很高。
可修复和可快速修复成为数据中心用户和设计者在系统设计时追求的首要目标。只要组成
系统的所有具备独立功能的子系统,在系统投入运行后都是可拆卸、可移动、可更换的,那末
这个系统必然是可修复的。
可快速修复通常指可无工具拆卸和可拔插更换子系统和设备。但是,如果功能相同的两个
设备可冗余配置,当一个设备故障停止运行后,另一个与之冗余并机的设备可继续工作而保证
系统正常运行,那末,对于整个系统而言,我们可以认为冗余并机环节没有发生造成系统宕机
的故障,可靠性很高;也可以认为虽然设备发生故障,但是在修复过程中没有影响整个系统正
常运行,修复时间为零。
以上设计理念已在数据中心基础设施用户和设计者中取得了最广泛的共识,并在系统方案
设计和建造中取得了广泛的应用和显著的效果。
二、“系统模块化”是可修复和可快速修复的根本条件
1
我们把具有独立功能,在系统中可整体安装、拆卸、移动、更换的子系统称之为模块,那
末上面的设计理念可概括为以下三句话:
1、 现代的数据中心要求基础设施必须是一个能连续工作的系统;
2、 一个能连续工作的系统必然是可修复和可快速修复的系统;
3、 一个可修复和可快速修复的系统,组成该系统的所有子系统必然要具备模块化特征;
模块化即将完整的产品或流程按功能分成小块,即模块。根据上面讲的,模块的特征应该
是:
模块是系统中一个具有独立功能和可独立运行的单元;
结构上可整体安装、拆卸、更换、移动;
相同单元可冗余并机运行;
在系统中,根据需要对这些模块进行组装,以产生原始产品/流程的各种变体。以我们很
熟悉的手电筒电池为例:可以将不同数量的电池(模块)进行组合,从而获得不同功率的电
源。在 IT 设备中,刀片式服务器和 RAID 阵列也是模块化的典型例子 – 将多个设备组合在
一起获得不同数量的服务器或不同大小的存储容量。模块无需完全相同:以 Lego™ 积木为
例,这些模块在某些方面相同,某些方面却不同,譬如,其颜色、大小和形状各不相同,但连
接方式和尺寸均采用标准形式,以便可以将积木(模块)组装成一个集成系统。不同的模块化
系统可以根据所需的功能划分目标,将不同数量的相同模块或不同模块(表示不同的标准化级
别)并入集成的模块或系统中。