文/俞雄
传统的数据中心通常采用“一机一业务”的部署模式,但是随着数据中心规模不断扩大,这种部署模式会带来管理运营成本过高、业务上线缓慢等问题。通过引入虚拟化技术把数据中心物理设备进行资源池化可以解决上述问题,提高业务部署效率、降低业务迁移的难度。但是同时也带来了如何对虚拟化平台进行监控管理的新问题。
虚拟化平台的监控管理能力对维持虚拟资源池可靠运行尤为重要。虚拟化后单台主机上运行着多台虚拟机,多个业务系统,而现有的虚拟化平台无法对这些业务系统的资源占有情况以及运行状况进行实时监控,对物理主机多个虚拟机之间的拓扑连接情况也是无法直观的显示出来。上述的问题都对虚拟化环境下的监控管理提出了新的要求与挑战。
H3C CAS虚拟化管理平台(下文简称CAS)针对虚拟化平台的上述问题作了改进。在资源池运行状况和业务系统进行了监控,提高了资源池的监控粒度,并输出详细告警和报表。下面会对这些改进做详细分析。
一、资源池运行情况展示与分析
相比传统虚拟化平台关注单个物理主机或虚拟机监控的管理思路,CAS则强调对整个虚拟化系统统一进行监控,全面评估虚拟化系统的健康程度,通过数字或图表的方式展现出来。下面的这些监控指标可以很直观的展示资源池的整体运行情况,从而提高虚拟化平台的可用性。
l资源池健康度分析
CAS通过内置的系统健康度评价模型,从主机、网络、存储等多个维度,对资源池中物理主机和虚拟机的CPU、内存、网络、存储等资源利用率及告警进行综合分析,得到系统健康度评分。当系统健康度得分低于80,就代表系统运行已经存在风险,需要管理员重点关注;当得分低于60,系统则处于高危环境,管理员可通过分析资源池中各物理主机的健康情况进行深入定位,及时找出问题。这种全新的虚拟化健康度管理方法覆盖了虚拟化环境所有层面&#