华东建筑设计研究院有限公司    林海雄
 
1  前言
    当前随着IT技术的迅猛发展,越来越多的企业、机构开始着手建立自己的数据中心以支撑其各项业务的持续发展。数据中心机房作为整个业务系统的核心区域,内部设备众多,互相协调性高,同时要求有良好的机房环境(供配电、UPS、空调、消防、保安等)作为基础条件,才可能高效地发挥数据中心的运行效率。事实上,数据中心的环境设备一旦出现故障,即刻就会影响IT系统的运行,对数据传输、存储及系统运行的可靠性均会构成威胁,如事故严重又不能及时处理,就可能损坏硬件设备,造成严重后果。
    因此,目前许多数据中心的管理人员不得不采用24小时专人值班,定时巡查机房环境设备,这样不仅加重了管理人员的负担,而且更多的时候,不能及时排除故障,对事故发生的时间及责任也无科学的管理。何况现在国内普遍缺乏机房环境设备的专业管理人员,有些数据中心不得不安排软件人员或者不太懂机房设备管理甚至根本不懂机房设备维护的人员值班,这对数据中心的安全运行无疑又是一个不小的隐患。
    正是为了解决上述问题,已经有越来越多的数据中心在建设中引入了机房环境监控系统,对机房内设备运行环境和机电设备的运行状况进行严密监测,实现了机房环境设备的统一监控,减轻了机房维护机房环境监控系统人员负担,提高了系统的可靠性,实现了机房的科学管理。本文将从系统功能这个角度,对数据中心环境监控系统做个初步探讨,以供同行技术人员在实际工作中参考。
2  数据中心环境监控系统监控对象
    许多工程的实践证明,一个数据中心的环境监控系统要正真起到保障机房良好运行环境的作用,需要监控、监测的环境设备至少要包括如下内容:UPS系统、精密空调系统、供配电系统、接点式漏水检测系统、温湿度检测系统、消防系统监测。
3  数据中心环境监控系统的组成
    在实际工程中,一个数据中心的环境监控系统通常由监控主机、计算机网络、智能模块、协议转换模块、信号处理模块、多设备驱动卡及智能设备等组成。为了增强系统的功能,用户可根据需要选择配置多媒体声卡、智能电话语音卡、超级视频卡等设备。目前较流行的环境监控系统,还进一步增强了系统的报警功能,除现场的多媒体报警外,另设置了电话通知、短信通知、E-MAIL 通知报警等,所以能适应现场无人值守的实时监控模式。
    图1为常见的环境监控系统图。
4  数据中心环境监控系统的监控功能
4.1  UPS 系统监控
    UPS是数据中心为IT系统提供稳定电源的关键设备,数据中心许多设备如服务器、小型机、路由器、网络交换机等设备,都需要使用稳定的不间断电源,以防止数据丢失,因此监管好UPS系统非常必要。
    在数据中心的电源区,环境监控系统通过UPS厂家提供的智能通讯接口及通讯协议,实时地监视UPS整流器、逆变器、电池、旁路、负载等各部分的运行状态与参数。环境监控系统可全面诊断UPS状况,监视UPS的各种参数。一旦UPS报警,将自动切换到相应的UPS运行画面。越限参数将变色,并伴随有报警声音,有相应的处理提示。对于重要的参数,可作曲线记录,可查询一年内的参数运行曲线,并可显示选定具体时间(以天为单位)该参数的最大值,最小值,方便管理员全面了解UPS的运行状况,及时地发现并解决UPS运行中出现的各种问题(如图2所示)。
4.2  精密空调系统监控
    环境监控系统通过机房精密空调自带的智能通讯接口,可实时、全面诊断空调状况,监控空调各部件(压缩机、风机、加热器、加湿器、去湿器、滤网等)的运行状态与参数,并可远程修改空调设置参数(温度与湿度))实现空调的远程开关机。环境监控系统一旦监测到有报警或参数越限,将自动切换到相关的运行画面。越限参数将变色,并伴随有报警声音,有相应的处理提示,及相关处理提示。对重要参数,可作曲线记录,用户可通过曲线记录直观地看到空调机组的运行品质。空调机组即使有微小的故障,也可以通过系统检测出来,及时采取步骤防止空调机组进一步损坏。对严重的故障,可按用户要求加设电话语音报警(如图3所示)。
4.3  供配电系统监控
    (1)配电参数检测
    数据中心所有供电电源的质量好坏将直接影响IT设备的安全,因此对数据中心市电进线的供电参数实行监测非常重要。
    环境监控系统采用智能电量检测仪(如图4所示),对数据中心的总输入电源柜的电量进行检测。电量仪是集三相相电压、相电流、线电压、线电流、有功、无功、视在功率、频率、功率因数、电度等参数于一体的智能仪表。该表带有报警功能和智能通讯接口可与环境监控系统主机相连采集所需的参数,使用户能方便读取配电的电流、电压,了解供电质量,并可查看所监测配电线路的参数及其历史曲线。通过分析有关参数的历史曲线,数据中心管理员能清楚地知道供电电源的质量是否可靠完好,为合理地管理数据中心电源提供科学的依据。
    (2)开关状态检测
    环境监控系统监视数据中心内各级低压配电输出开关的状态。数据中心的管理员监视配电开关是否跳闸或断电等状态非常必要,因为一旦开关跳闸断电,IT系统立即停止工作,将造成整个系统崩溃,如不尽快处理造成的损失将无法估计。当开关跳闸或断电时,环境监控系统自动切换到相应的运行画面,同时发出多媒体语音和电话语音报警,通知管理员尽快处理,并将事件记录到系统中(如图5所示)。
4.4  漏水监控系统
      数据中心内如不慎发生漏水,不及时发现并清除,后果将不堪设想。事实上,数据中心内的架空地板底下有着诸多的漏水水源,如空调机组的冲洗水回路、排水管等,而且又不容易及时发现,因此以环境监控系统对数据中心内的漏水水源旁进行实时的监测是十分必要的。
      根据数据中心场地的情况,采用绳式漏水传感器将水源包围起来,一旦漏水,可确保系统在第一时间报警,使维护人员能尽快地进行处理。漏水监控系统本身包括:漏水控制器、漏水感应线及其他辅助设备,系统可检测感应线上任何点的漏水位置并有报警输出。这类系统有时还可用作数据中心洁净度的检测,当感应线上的尘埃集结到一定厚度,系统会报警提示管理人员派人处理(如图6所示)。
4.5  温湿度检测系统
      对于面积较大的数据中心,由于气流及设备分布的影响,温湿度值会有较大的区别,这时候可以根据数据中心的实际面积,加装一定数量的温湿度传感器,来检测数据中心内的温、湿度。通过环境监控系统采集数据中心内部各空间点位的实时温湿度,提供各点位准确的实际温湿度值,便于管理员通过调节送风口的位置、数量,设定空调的运行温湿度值,尽可能让数据中心各点的温湿度趋向合理,确保设备的安全正常运行(如图7所示)。
    另外,电池间电池使用寿命的长短,直接跟环境的温湿度有密切关系,所以为了保证电池的使用寿命,管理员也需要了解电池间的温湿度,并使其温湿度值控制在合理范围内。
4.6  消防监测系统
    通过数据中心的环境监控系统接收来自消防控制箱给出的报警信号,实时监测数据中心内的火灾情况,即便无人值守,也可以确定消防工作状态。消防一旦报警,系统可根据需要联动门禁系统打开所有的门锁,让工作人员能尽快地脱离现场,同时启动相应的消防灭火措施。
5  数据中心环境监控系统软件平台的基本要求
    在实际应用中,数据中心的环境监控系统的软件平台需要具有完备的Web化的远程管理功能。数据中心的管理员可以在网络连接的任意位置,通过浏览器浏览所有数据中心环境设备的实时信息:遥测、遥信、曲线等,可查看报警事件,也可进行报警设置、系统配置等工作,远程站与当地监控站应具有完全一致的图形界面。
系统的软件平台要具备强大的数据管理功能,一般要求存储一年的历史数据,在同一个集成环境下或在浏览器内查阅一年内任意一天的历史曲线。
    系统的软件平台要具备完整的权限管理功能,可以规定每个用户可以浏览的内容以及该用户可以操作的设备,并且对每一次连接、登录以及对设备的操作都有详细记录,便于核查。
    系统的软件平台要具备数据中心环境设备维护保养功能,系统可以为数据中心的管理员建立起数据中心环境设备厂商定期维修保养通知及自动打印保养报表,可以自行定义维护保养内容。
6  结束语
    上面我们从监控对象、系统组成、功能等几个方面阐述了数据中心的环境监控系统的概念,实际上要正真为一个数据中心建设一套完善的环境监控系统,需要根据数据中心特定的业务需求、管理模式、建筑结构、空间规模、平面布局、分期规划等众多的相关因素进行量身定做的,实际工程中各个数据中心应该各自配备符合自身特点的个性化的环境监控系统,不存在千篇一律的统一标准。