ITIL重大事件管理综合指南

什么是ITIL重大事件?

重大事件是一个高影响力的紧急问题,通常影响整个组织或其主要部分。重大事件几乎总是导致组织的服务变得不可用,从而导致该组织的业务受到打击,并最终影响其财务状况。重大事件可以通过两种方式影响组织的服务:

  • 通过阻止客户访问组织的服务。
  • 通过破坏员工按时完成工作的能力,导致业务中断。

准备充分的服务台可以评估重大事件,并提出解决方案或解决方法,以减少和控制重大事件的影响。

事件管理和重大事件管理有什么区别

事件管理是在商定的服务级别协议 (SLA) 内管理 IT 服务中断和恢复服务的过程。事件管理的范围从最终用户报告开始 一个问题,并以服务台团队成员解决该问题结束。

鉴于重大事件管理 (MIM) 是管理重大事件的过程,这些事件是高影响力的紧急问题,通常影响整个组织或其主要部分,导致组织 业务受到打击并最终影响其财务状况。

MIM 的范围从识别从多个来源报告的主要事件开始,到服务台审查主要事件结束。审查对于更好地了解如何处理和 改进 MIM 过程。

ITIL中重大事件的4个阶段

重大事件的4个阶段是:

  • 第 1 阶段:识别
  • 第 2 阶段:控制
  • 第 3 阶段:解决
  • 第 4 阶段:维护

第 1 阶段:识别

宣布重大事件:

第一步是确定可能的重大事件。组织必须设置多种方法来识别威胁。当技术人员遇到异常工单时,技术人员可能会标记重大事件,或者他们 可以通过网络监控工具等解决方案进行检测,这些解决方案可以自动标记网络问题并创建票证以提醒服务台。组织还可以为服务台人员设置专用热线 标记可疑的重大事件。

通知利益相关者:

一旦确定了重大事件,就需要传达给所有关键利益相关者。有四个主要群体需要了解重大事件:

  • 技术团队:请务必立即通知技术团队,以便他们可以开始决定解决问题的行动方案。
  • 管理:让高层管理人员(如首席信息官)了解重大事件有助于问责制。组织还应向管理层通报为解决重大事件而采取的所有步骤。
  • 主要利益相关者:部门主管和服务级业务管理人员还需要了解重大事件并定期接收状态更新。
  • 用户:用户需要知道哪些服务可能由于重大事件而不可用。

第 2 阶段:控制

  • 组建重大事件小组:重大事故小组,简称MIT,由技术人员、服务级别管理负责人和其他关键利益相关者组成;有时,高技能的外部人员会被请来处理重大事件。重大事件小组共同努力,为重大事故找到解决方案,并使运营恢复正常。
  • 搭建会议桥梁:会议桥,通常称为电话会议,有助于进行有效的故障排除和集中通信,它是MIT成员之间清晰、快速的沟通渠道。
  • 准备一个指定的作战室:有一个指定的作战室可以让MIT的所有成员聚集在一起解决事件,这增加了协作努力,以更快地提出解决方案。
  • 创建问题工单以识别潜在问题:可以创建问题工单来发现和了解重大事件的根本原因,通过解决重大事件的原因来帮助防止未来发生类似的重大事件。

第 3 阶段:解决

  • 将重大事件的修复作为变更来实施是一种良好的做法,以确保解决方案得到适当的记录和实施。
  • 将解决方案作为变更来实施,可以最大限度地降低因解决方案失败而中断其他服务的风险。

第 4 阶段:维护

  • 执行实施后审查:重要的是要在一段时间内对事件进行评估,以确保它是真实的解决。如果根本问题得不到解决,可能会导致另一起重大事件。
  • 记录清晰的文档:记录解决重大事件的整个过程有助于组织为未来类似事件做好准备。有了对过去事件的适当记录,当面临另一个类似的重大事件时,组织可以立即实施久经考验的解决方案,从而减少其影响。
  • 测量指标:衡量服务台的性能有助于衡量服务台和MIM流程的有效性。要衡量的一些重要指标有平均确认时间(MTTA)、平均解决时间(MTTR)、重大事件总数和重大事件的平均停机时间。

ITIL中重大事件最佳实践

  • 启用多个渠道报告重大事件
  • 自动化服务台流程
  • 争取及时、相关的沟通
  • 创建清晰的文档
  • 利用与ITOM软件的深度集成

启用多个渠道报告重大事件

在处理重大事件时,时间至关重要。组织在发现重大事件后立即识别和分类至关重要。为用户提供多种报告事件的方法将使整个过程更快、更容易访问。您可以通过电子邮件或门户网站创建工单,甚至可以设立专门的热线来报告可疑的重大事件。设置网络监控软件来检测异常情况可以帮助您主动处理重大事件。

自动化服务台流程

速度和效率在控制重大事件的影响方面发挥着至关重要的作用,而自动化各种服务台流程有助于将技术人员从通知利益相关者等重复任务中解放出来,从而实现这一目标。自动化通知系统和设置重大事件工作流是自动化服务台流程的好方法,可以缩短解决时间。

争取及时、相关的沟通

重要的是要让组织的管理层和重要的利益相关者了解每一个重大事件。让管理层了解情况将有助于获得修复重大事件所需的必要批准和权限。及时沟通确保所有重大事件人员都知晓,并允许顺利、有效的协作;它还让最终用户随时了解任何可能的停机时间,以便他们做好准备。

创建清晰的文档

清晰的文档有助于重大事件经理记录为修复重大事件所做的所有工作、其影响、受影响的服务以及有关重大事件的其他关键信息。此文档对于向管理层展示MIM流程的好处(包括投资回报率)非常重要。清晰的文档也将有助于处理未来任何类似的重大事件。

利用与ITOM软件的深度集成

与ITOM软件的强大集成使IT部门能够主动处理重大事件。反应式重大事件识别依赖于大量工单来出重大事件正在进行的危险信号。另一方面,利用ITOM集成的主动MIM流程具有适当的系统来监控网络和服务,并可以自动标记可能是潜在重大事件的异常。

版权声明:本文内容为知乎博主「ManageEngine卓豪」的原创文章

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值