系统管理是指对IT网络和业务运营进行集中管理,使其顺利共存和运行。它有助于确保高质量的网络服务和不间断的业务运营,从而避免冗余性能中断。
IT 系统管理对于监控和管理网络设备、数据中心和应用程序以提供高 QoS 和丰富的 IT 基础设施非常重要,它还可以帮助管理员进行日志管理、帮助和服务台管理、安全性和合规性、性能分析、库存管理、自动化等等。
在 IT 系统管理中,服务交付始终被视为冰山一角。有各种底层异构系统可帮助 IT 团队向最终用户提供业务服务。这些系统包括路由器、防火墙、交换机、广域网加速器、服务器(物理/虚拟)、应用程序/服务、负载平衡器、机架、传感器、冷却系统等等。提供简化的 IT 服务取决于这些系统的性能。这要求每个系统都应在其整个生命周期内进行战略规划、部署和维护,在其任期的大部分时间里,这些系统仍处于运营和维护阶段,在那里它们受到运行状况和性能的监控,并优化了资源。
全面的系统管理软件
理想的系统监控解决方案应该包括:
- 网络系统管理
- 服务器和基本应用程序监控
- 故障管理系统
- IT 工作流自动化
网络系统管理
OpManager 的系统管理使用SNMP/WMI/CLI网络协议来获取有关网络设备性能的数据并执行基于阈值的监控。当阈值水平超过时,会通过各种通知渠道(如短信、电子邮件、工单日志和网络警报)提醒管理员。还可帮助管理员解决网络中断问题、排除WAN延迟、分析WAN流量、监控VoIP性能、管理配置等。
服务器和基本应用程序监控
单个控制台监控物理和虚拟服务器,如VMware、vSphere、VMware ESX、Hyper-V、Xen和Nutanix集群以及关联的VM。通过监控关键性能指标,如可用性、响应时间、进程计数、服务性能、硬件指标等,系统管理软件可以检查服务器的运行状况,并执行有效的服务器性能管理。还监控Exchange、MSSQL和Active Directory等基本应用程序,以及服务器上运行的服务和进程。
故障管理系统
故障管理系统的工作原理是检测系统网络性能,通过通知配置文件发出故障警报,并通过手动干预或自动化修复故障。自动故障排除选项包括触发自我修复脚本或运行预加载的程序。管理员还可以选择将警报上报给备用人员,从而确保没有警报无人看管,也没有故障未解决。这可以帮助管理员快速找到问题的根本原因,从而实现较低的平均恢复时间(MTTR)。
IT 工作流自动化
IT 工作流自动化可帮助您自动执行重复、费力的 IT 任务和一级故障排除,OpManager 的工作流是无代码的,可以作为解决网络故障的反击行动启动。系统管理解决方案中有多个工作流操作,管理员可以通过定义条件、选择设备和命令来自动执行例行但耗时的任务。