理解IT运维管理体系
@(IT运维)[运维管理体系, 帮助]
IT运维一体化
- 针对IT运维,可以分为三个方面,监控、管理、控制,“监、控、管”三者紧密关联,逻辑上是一条闭环环路。
- 监控的结果作为依据进行分析、决策和指导IT运维工作;IT运维工作本身需要资源管理和流程管理来进行资源统一管理、工作规范化和标准化(流程化);自动化运维将IT运维中大量、重复性工作进行编排控制,自动完成,节省人力成本,提高运维效率;IT运维工作的结果和质量需要通过监控得到进一步观察和确认,以判断是否符合工作预期,必要时可进行即使调整和提高。
“监、控、管” 运维管理体系的协同
- "监"和"管"的协同:IT资源的管理在CMDB,监控对象和监控指标体系存储于CMDB,监控与CMDB的联动,获取CMDB数据实时更新监控对象,实现基于CMDB的监控管理。
- "监"和"控"的协同:监控的告警作为条件触发自动化作业执行,实现监控和自动化的联动,逐步实现故障治愈。
- "监"和"营"的协同:监控的性能数据,告警事件在可视化大屏中集中展示,实现运维可视化。
“监、控、管”运维管理体系的意义
- 监控是眼睛,帮助我们透视和认清 网络、主机、应用和整个IT运维环境,使我们情报的来源;
- 流程管理是我们的大脑,帮助我们思考、制定决策、完成流程控制和管理,是我们情报分析和决策中心;
- 资源管理是整个IT运维环境基础数据的来源,包括计算资源信息,企业人员信息,监控资源信息等,使我们情报对象的集合;
- 控制是我们的双手,完成自动化批量处理,是我们的实现力量和手段。
IT"监控管"一体化运维
- 在监控管的一体化运维管理模式下,当监控管理模块发现故障并产生告警后,如满足相应的过滤或触发条件,通过接口自动触发运维流程管理模块生成相应工单,运维流程管理模块依据工单的信息和运维人员预先设置好的关联条件,自动寻找、识别和匹配自动化运维模块中的操作脚本,实现自动和快速的故障操作处理,由此实现从故障发现到解决故障的IT运维全自动化,并自动完成运维操作的日志记录,以备事后查询和审计。