这个话题源自客户的提问:如果监控报告发生了异常,
1. 运维团队处理了,这算是Even还是Incident管理流程?
2. 如果没有处理,异常越来越严重(当然处理的时候也有可能问题越来越严重),发生了危机,是属于Incident的管理流程还是需要建立一个新的流程(Crisis Management)?
其实这一场景的管理,在ITIL 4中,划分为三个实践: 监控和事态管理(Monitoring and Event Management ), 事件管理(Incident Management)和服务连续性管理(Service Continuity Management)。在回答这个问题之前,我们先看看这三个实践的范围和流程。这里先要说明,由于翻译的问题,Incident Management从ITIL V3,一直翻译成事件管理,其实我认为翻译成故障管理更合适。为了避免歧义和不纠结翻译的问题,下文都用英语单词Event, Incident描述。
区分三个关键词语
事态 Event: 对服务或其他配置项(CI)的管理具有重要意义的任何状态更改
事件 Incidnet: 服务的意外中断或服务质量的降低
灾难 Disast