向模块化和分布式管理挺进(转贴)

向模块化和分布式管理挺进

——从IPMI 2.0看服务器管理技术的发展趋势

■ 白云飞



智能平台管理接口(IPMI:Intelligent Platform Management Interface)是一项应用于服务器管理系统设计的标准,由Intel、HP、Dell和NEC公司于1998年共同提出,当前最新版本为2.0。利用此接口标准设计有助于在不同类服务器系统硬件上实施系统管理,使不同平台的集中管理成为可能。

设计实例凸显IPMI优势

先让我们来看一个IPMI设计的应用实例:一家公司购置了若干台服务器,计划安装不同应用系统分别应用于数据库、网络、打印服务器等。传统实现方式是分别由在某一应用系统有专长的不同系统管理员逐一完成安装、配置及后期维护管理,但利用IPMI管理即可实现统一的管理。以下从安装配置、监控管理、故障诊断三方面来领略一下IPMI带来的优势。

传统的OS安装首先要对服务器的新硬件做驱动,需要相应OS安装手册或专业系统管理员,管理员需要在服务器旁等待整个安装过程完成;而利用IPMI,只需要插入OS自安装光盘即可自动引导安装,在3~4个关键时间点加载新硬件驱动,插入OS安装盘,即可完成OS自动安装,同时还可以利用系统备份工具对重要数据进行备份,方便了故障出现时的系统恢复,极大地节省了时间和人力。

传统的系统监控管理方法一般是系统管理员定期到机房巡视或者采用PCAnywhere类软件监控,上述方法存在时效性差、服务器宕机后无法追查原因、占用系统资源较多的缺点;IPMI则可实现对服务器系统的实时监控,能够监控网络状态(发现整个网络节点、判断网络节点的在线状态、判断网络的通断、监测网络结点的OS、IP、主机名、网络流量大小等信息);监控服务器系统静态信息(CPU、内存、硬盘、光驱、网卡、显卡、操作系统、RAID卡、PCI附加卡等信息)和动态信息(主板、CPU、SCSI 模组、风扇板等设备的温度、电压、风扇转速信息以及CPU利用率、内存利用率、硬盘I/O访问流量等系统资源信息),还可以实现对RAID阵列的管理;当上述被监控量发生超越门限等异常事件时,监控软件会通过多种形式(消息框、邮件、告警音、短信)告警,同时将告警事件记录入日志,方便管理员根据告警日志分析诊断。对大量分散服务器集中管理的环境应用优势尤为明显。

传统的故障诊断一般是管理员到故障现场根据经验诊断故障原因,而利用IPMI,管理员可以通过网络或者串口访问远端服务器,通过获取事件日志和传感器数据记录来分析、确认故障原因,并通过远程操作来实现服务器恢复。

表象之下的技术

上面我们了解了IPMI带来的优势,那么它是通过何种方式实现这些功能的呢?我们来了解一下表象之下的内容:

在IPMI管理平台中,BMC(Baseboard Management Controller,因为多集成于主板而得名)是核心控制器,系统管理软件对各个被管理器件的管理,都是通过与BMC通信来实现的。

在IPMB(Intelligent Platform Management Bus)总线上连接着各个管理控制器,分别执行不同功能。IPMB总线上还连接着一些I2C器件,用来作为传感器的接口,让系统管理软件能够通过IPMB来读取传感器的数据。同时,这些传感器的具体配置信息,如告警门限、事件触发是否允许等配置都保存在一组名为SDR(Sensor Data Record)的数据里面。而传感器产生的告警事件则保存在一组叫做SEL(Sensor Event Log)的数据里面。在IPMB总线上,连接着一个ICMB(Intelligent Chassis Management Bus)桥,通过ICMB可以和远程的另一个管理平台通信。此外,在IPMB总线上,还可以外接其他的用户板,用来扩展IPMI管理平台的功能。

管理系统的核心——BMC芯片就相当于计算机中的中央处理器,通过BMC芯片上一对SMBus接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过RS-232接口连接Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取SDR、SEL数据,分析诊断故障原因;BMC通过IPMB接口访问模组风扇背板、电源背板等上的SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC通过系统接口(多用SMIC:Server Management Interface Chip),实现IPMI消息传输机制,控制LCD显示和实现上层软件与底层F/W通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的E2PROM。所有IPMI功能通过向BMC发送命令来完成,命令使用IPMI规范中规定的指令,BMC接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。

IPMI 2.0的新特点

IPMI 2.0是今年2月最新通过的版本,与其前一版本1.5相比,做了多项增强。

SOL(Serial Over Lan)远程管理

IPMI 2.0中定义了SOL指令,利用它们可改变IPMI会话过程中本地串口传送数据方向,从而实现对远程服务器的Pre-os访问,提供了通过LAN远程查看、启动、诊断和维修故障的标准方式。

其实现原理为:用户在控制端通过LAN连接远端服务器(控制端需要根据SOL定义指令设计软件来实现监控,远端服务器上BMC硬件连线及底层代码需要根据SOL定义连线、指令做相应设计),即可在控制端通过安装的软件监控到远端服务器POST整个过程,并可以实现远程接管,进入并修改BIOS设置。远端服务器主板上必须有BMC芯片(或通过外插卡上BMC芯片),BMC芯片和网卡芯片间有SMBus连接,控制台通过网络连接,从BMC获取POST信息。

增强的安全特性

安全问题是任何网络解决方案远程控制都需要考虑的重要因素。IPMI 2.0定义了安全哈希算法-1(SHA-1)和基于密钥哈希消息认证以支持高级认证,给用户安全提供了更高保障;定义了高级加密标准(AES),提供高级加密功能。

对VLAN的支持

VLAN给了系统管理员更多的控制权,加强了系统的安全性。通过在物理LAN上构建一个管理LAN,用户可以保护LAN上的数据不受其他通信的影响,因为在VLAN环境中,只有系统管理员设置的某些控制台可以看见和执行命令。

IPMI 2.0对VLAN的支持为设置管理专用网络提供了方便,并且可以根据管理范围进行配置。这些LAN会话增强的功能加上新定义的有效负载能力(Payload),使多种类型的管理数据流可通过一个LAN会话传送。

未来的技术趋势

国内外监控管理厂商的管理产品多种多样,较为常见的有设备监控管理产品、网络监控管理产品、应用监控管理产品等等,几乎涉及IT 产业的各个领域。从对业界一些管理产品的分析来看,有以下一些发展趋势:

全方位模块化、实时化管理

管理系统模块化趋势明显:设备管理、监控、应用管理与监控、安全风险管理、备份与恢复、快速部署及软件分发、远程控制(KVM)、资产管理、公共基础服务等功能模块跟整个管理系统形成了松耦合关系,用户可以根据自己的实际需求定制适合自己的服务器管理产品。同时远程控制发挥了越来越明显的作用,借助相应的远程控制工具,管理员在远程控制端可以实现像在服务器现场一样的管理,时效性大大增强。

管理技术标准化

优秀的管理产品一般都具有较强的平台无关性和通用性,大多都是按照标准协议进行开发,从底层的数据采集,到中间的通信协议,以及终端的管理应用,都由相关的管理标准所覆盖。IPMI 2.0就是很好的一个管理技术标准。

对被管对象的描述标准化

SNMP管理协议,被管对象的描述是按照面向过程的方式对被管对象逐一列举;DMI(Desktop Management Interface)对被管对象采用面向对象的描述方式,将被管信息统一组织,并提供一系列接口给管理程序应用;CIM(Common Information Model)使得管理对象、被管信息和访问方式完全面向对象化。

CIM 是DMTF(Desktop Management Task Force)提出的通用信息管理模型。它以面向对象的方式对系统管理的不同问题域进行描述,使得不同管理系统和应用之间能够共享和交换管理信息。它由两部分构成: CIM 规范(CIM Specification)描述了建模语言、命名规则、元模式以及与其他管理信息模型(SNMP 的MIBs ,DMTF 的MIFs 等)之间的映射(Mapping);CIM 模式(CIM Schema)提供了实际的管理信息模型描述,同时还提供了一整套类(Class)用以组织计算环境中的各种管理信息。

目前,在对网络设备的管理中,标准CIM 模型采用得越来越多,从设备监控、安全监控、存储管理等各个方面都有产品应用。这也是下一代服务器管理产品的应用趋势。

管理方式逐步向分布式发展

传统的管理产品一般是M/A架构,一个管理中心和多个被管设备之间进行独立点对点通信,被管设备之间没有任何联系,限制了网络资源的共享和使用,而且对管理员的管理方式也有限定。随着管理系统的发展,被管设备之间的联系会逐步加强,不但管理中心可控制访问被管设备资源,被管设备之间也可以实现资源共享。 (本文作者为联想集团慧眼管理系统研发工程师)

阅读更多
上一篇联想:从服务器智能监控管理入手 (转贴)
下一篇微星:服务器主板产品具备IPMI功能 (转贴)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭