摘要:
传统服务器系统运维管理方法一般是系统运维人员到机房巡视或者使用操作系统的远程桌面来进行操作.该方法存在效率低下,服务器宕机后无法追查原因,对系统资源要求较高的缺陷.而利用服务器管理功能(IPMI),管理员则可以在任何地点通过网络访问远端服务器,从获取的事件日志和传感器数据记录对服务器系统的状态和故障进行分析并确认故障原因,通过相关的设定来实现服务器恢复,通过预警功能可以较早的发现服务器系统的隐患所在,从而保障业务的正常运行.论文介绍了 IPMI管理的相关概念,及其在国内外的研究发展现状与前景.分析了目前管理方式存在的一系列问题,并对现今管理方式存在的缺陷进行归纳并分析了业内的常用管理软件.论文结合当前管理的特点,在改进传统服务器管理的基础上提出了一种新的服务器系统管理的方法-基于浪潮IPMI的服务器管理系统(Inspur-IPMI),分析设计了该系统框架中各部分模块的功能,并对整体系统进行了软硬件方面的设计和实现.该系统主要包括实时监控,在线预警,日志检查等功能.通过该系统实时监控被管理的服务器,发现被监控服务器节点的整体状态,并根据网络节点的通断,监控检测被管理服务器的操作系统,资产信息,部件状态,处理器,内存,网络流量大小等信息.可以监控服务器内各种部件的静态信息,还可以监控服务器中各部件的动态信息;在预警方面,当上述被监控量发生超越阈值等异常事件时,软件会通过多种形式告警,同时将告警事件录入日志,管理员根据告警日志分析诊断.日志功能对于服务器的运行状态进行了实时记录,对于各项指标进行了记录,方便管理员的查询.此管理方法对大量分散服务器集中管理的环境应用优势尤为明显.论文采用基于IPMI管理方式,可以通过普通的浏览器界面来实现服务器系统的管理,并结合具体的芯片对于系统进行了硬件和软件方面的实现,最后通过在浪潮实际的服务器主机平台上和管理终端的严格测试,各功能项目得到了完全实现,全面提升了服务器系统的管理方式和方法,有效降低了客户的运维成本,保障了客户业务的正常运行,提高了服务器系统的健康性和可靠性.
展开