高性价比的IPMI远程管理方案 (转贴)

高性价比的IPMI远程管理方案

上网时间 : 2002年10月26日
 

要操纵地理上分散的高级服务器、电脑中心,并提供全天候的服务,通常都费时费力。管理信息系统(MIS)的工程师必须亲自到远端,才能完成象复位和重新上电这样简单而又重复性的服务器管理任务。这个问题的解决方案之一是在中心远程终端上升级服务器,使之具备可管理性,以此来降低总占有成本(TCO),本文就介绍一种高性价比的智能平台管理接口(IPMI)的远程管理方案。

智能平台管理接口(IPMI)定义了在中心终端上通过LAN或串行调制解调器管理和监视远程服务器的途径。通过IPMI还能提供系统健康状态监视、对严重事件自动产生告警、自动系统控制(如断电、重新上电、复位)以及系统事件日志记录等功能。基于IPMI的服务器系统拓扑如图1所示。

IPMI结构的核心是一个被称为基板管理控制器(BMC)的微控制器。BMC可以用来提供智能平台管理的智能,控制系统的管理软件和平台管理硬件之间的接口,提供自主监视、事件记录和恢复控制功能,并可作为系统管理软件和IPMB与ICMB接口间的网关使用。

平时BMC会收集有关系统健康和系统状态信息,当有严重事件发生时可以执行纠正动作。通常系统健康监视功能是利用菲利浦的I2C数字传感器(如LM75、LM85、LM84、LM86)实现的,它能监视不同的系统电压、温度和风扇速度。BMC采用主动轮询的方式来发现是否存在超出范围的传感器。为了使监视工作切实有效,BMC可以根据不同的门限值进行配置。例如,当BMC检测到温度超过某个告警门限时它就提高风扇速度,如果纠正不够,温度就会超过另一个紧急门限,此时BMC会切断系统电源、记录事件过程并通过LAN或串行调制解调器向远程终端发告警。图1:基于IPMI的服务器系统拓扑图。

除了系统健康监视外,IMPI还定义了访问现场可置换单元(FRU)信息的接口。这种信息包含有用于识别系统中不同部件的串行码和部件号,因此有助于降低总占有成本。

服务器最常发生的故障是由于意外事件或软件故障引起的操作系统和应用程序死锁。BMC包含有独立的看门狗(WATCHDOG)定时器,可用来检测多种软件组件如BIOS、操作系统、应用程序或诊断软件引起的系统死锁。当WATCHDOG定时器发生超时时,BMC可以自动复位系统、执行重新上电和/或将死锁情况通过LAN或串行调制解调器报告给远程终端。

智能平台管理接口

IPMI的主要功能如下。


1. 系统健康状态监视


对温度、电压和风扇状态等监视信息的访问需要通过IPMI传感器模型完成。在此,不能直接访问监视硬件的,IPMI提供抽象的传感器命令如“Get Sensor Reading”命令来访问监视硬件,实际上命令是通过管理控制器实现的。这种方法能使软件独立于平台管理硬件的变化。

2. 系统事件日志


平台事件的产生和控制方法基本相同。BMC提供集中稳定的系统事件日志(SEL)记录方式。SEL和BMC管理的记录功能有助于确保“post-mortem”日志信息能对系统处理器失效的故障及其发生的状况做出记录。

3. FRU信息


IPMI规范能够支持为系统中的不同模块存储多套非易失性现场可置换单元(FRU)信息并提供访问功能。企业级系统中一般每块系统主板(如处理器板、存储器板、I/O板等)都有FRU信息。FRU数据一般包含有串行码、部件号、模型和资产标签等信息。

4. 基于LAN的IPMI


IPMI消息要封装成UDP数据包,包的格式应符合DMTF Pre-OS工作组定义的RMCP UDP包格式。

5. 基于串行调制解调器的IPMI


IPMI定义了三种专用协议模式以满足不同的效率与标准化组合要求:(1) 基本模式,支持最高的速度和自动远程控制。(2) PPP模式,支持广泛存在的通信协议堆栈。(3) 终端模式,用于传统环境中功能有限的‘哑终端’文本访问。

6. 平台事件过滤(PEF)


PEF用于在新事件与“事件过滤器”的可配置设置相吻合时生成可选的动作,这些动作包括断电、重新上电、复位和发送告警等。可配置的事件过滤器具有从普通到专业的‘通配’功能。例如,人们可以配置某个过滤器使其在“非紧急”(如告警)事件时执行动作,配置另外一个过滤器使其只在紧急事件时执行动作。

7. LAN告警


LAN告警是以平台事件阱(PET)格式中的SNMP Traps方式发送到指定的某个告警目的地。

8. 串行调制解调器告警


有关串行调制解调器告警的标准支持:(1) 拨号寻呼(通过调制解调器实现的数字寻呼)。(2) TAP寻呼(通过与TAP1.3寻呼服务相连的调制解调器实现的文字字母寻呼)。(3) PPP告警(PET Trap通过拨号进行发送,并通过PPP建立与远程终端的连接)。

9. 告警策略


IPMI支持LAN和串行调制解调器二种告警方式。这些告警可以根据支持告警到多个目的地的“告警策略”进行配置。告警策略中的目的地包含有串行和LAN目的地以及告警类型。IPMI允许提供多个告警策略,因此能使系统为不同等级的事件提供不同的策略。例如,一个系统可以配置一种用于“高优先级”事件的告警策略,还可配置另外一种用于“低优先级”事件的告警策略。

10. 串行端口共享


IPMI具有规范管理逻辑,能使单个串行连接器在母板的串行控制器和到管理控制器的串行连接之间共享。

11. 启动选项


IPMI还定义了常用的一套可被BIOS读取的标识,这些标识可用来引导系统的启动过程。例如其中某些选项能引导BIOS启动到“服务分区”而非操作系统所在的主分区。启动选项还提供一个“邮箱”,可用来将一些特殊数据传递给BIOS或OS载入器。

12. 回叫图2 基于mBMC的系统管理拓扑。


IPMI在串行连接上支持二种回叫类型:IPMI消息回叫和CBCP回叫。IPMI消息回叫通过向BMC发“callback”命令启动,该命令会引发BMC中断连接并呼叫预先配置好的电话号码。CBCP则是微软定义的“回叫控制协议”,它只用于PPP连接。

13. 用户、权限和认证支持


IPMI支持对串行调制解调器和LAN接口的访问认证,包括:(1) 支持多个不同权限等级和接口访问权利的用户。权限等级包括回叫、用户、操作者和管理者访问。(2)用质问/响应协议完成用户认证。(3)串行和LAN消息采用MD2和MD5签名。(4)PPP连接支持CHAP/MS-CHAP/PAP协议。(5)可以把“Callback”用作串行调制解调器通信的认证机制。

迷你基板管理控制器(mBMC)

在BMC中完全实现IPMI功能需要一个功能强大的16位或32位微控制器以及用于数据存储的RAM、用于非易失性数据存储的闪存和固件。一个提供IPMI v1.5的典型BMC大约需要32k RAM和128k闪存。在这种情况下,服务器可管理性的实现总成本(包括BMC硅片、BMC固件和健康监视器件)将达40-50美元。这么高昂的成本将极大地限制IPMI协议在低成本服务器和网络连接设备中的推广应用。

采用IPMI协议的一种创新性解决方案是利用高性价比的迷你基板管理控制器,它在安全远程复位、安全重新上电、LAN告警和系统健康监视方面能提供基本的IPMI v1.5远程可管理性。由于性价比高,这款控制器还能用来管理网络设备,如公用台式电脑、打印机、集线器、数字电视机顶盒等。

这种控制器是一种一站式解决方案,用户无需做大量的固件开发工作,因此能缩短新设计服务器的面市时间。另外,因为mBMC兼容IPMI,因此它能应用于任何兼容IPMI的远程终端设备。

这种低成本控制器非常适合用于多种远程管理,比如刀片服务器、公用台式电脑、打印机、集线器和家庭网络设备(网关、数字机顶盒)等。

mBMC会周期性地轮询数字传感器来监视系统工作状态,并通过SMBus接口与主机通信,还提供一个用于本地系统管理、“推进”告警和访问非易失性存储器的接口。

“推进”告警用于从主机发送LAN告警到远程终端以通知BIOS或操作系统发生的任何事件。例如,紧急BIOS POST代码可以通过LAN从典型的0×80 I/O端口重定向到远程终端。

除了基本的IPMI功能和系统工作监视功能外,通过利用2个闪存之一存储以前的BIOS,mBMC还能实现BIOS闪速器件的选择和保护。例如,在远程BIOS升级后系统不能启动时,远程管理人员可以切换回以前工作的BIOS镜像来启动系统。一旦BIOS升级后,BIOS镜像还能被锁住,可有效防止病毒对它的侵害。

mBMC的主要功能总结如下:
(1) 为远程系统管理提供IPMI v1.5 LAN消息,包括系统状态监视;复位、重新上电、断电等底板控制;FRU信息,少量SEL信息用入口;BIOS保护和选择。
(2)为本地系统可管理性提供IPMI v1.5消息。
(3)对LAN消息采用MD5签名以保证远程连接的安全性。MD5签名加上私有口令能够很好地保护系统免受外部的侵袭。
(4)BIOS或OS可以将“推进”告警作为SNMP Traps,并通过LAN报告严重事件。
(5)自发地进行系统健康监视并对严重事件产生纠正动作。
(6)LAN告警。

参考文献

1. 2001年2月21日发行的智能平台管理接口(IPMI)规范 v1.5


2. 国家半导体高级I/O产品规范http://www.national.com/advancedio/

作者


Ilia Stolov


主任应用工程师


美国国家半导体公司


Ilia Stolov


主任应用工程师


美国国家半导体公司


Ilia Stolov


主任应用工程师


美国国家半导体公司

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页