尝试做新事情30天-阅读架构即未来05
危机管理和升级
什么是危机
复发性的问题浪费时间,摧毁服务和组织的扩展能力。因为危机占用大量资源,所以瓦解扩展性。允许危机的根源不止一次的出现会浪费大量的资源,所以瓦解扩展性。允许危机的根源不止一次的出现会浪费大量的资源,使组织和服务无法扩展,也会带来摧毁业务的风险。为什么要区分危机和其他的事故、
你不可能像处理正常事故那样对待危机,因为危机对你的影响与正常事故不同。这需要比往常更快的恢复服务,然后继续努力寻找问题的真正根源。时间的流逝,客户的满意度,未来的财务收入甚至业务的活力全都系于此。如果你不能及时的处理危机。那么首先,危机将延续,事故将复发,你会失去客户,收入甚至业务。其次,危机会长时间吞噬掉宝贵的业务时间,最终会使你失去对其他项目的吸引力。最终,你会失去荣誉。
作战室
- 大量的白板空间
- 能连接生产系统和实时数据的电脑或显示器
- 用来共享的投影仪
- 与作战室外团队通信的电话
- 连接聊天室
- 为几人工作而准备的工位
向客户道歉的说明
例;上个星期,我们公司经历了一个短暂的6小时的宕机时间,对此引起的任何不便,我们深表抱歉。
- 尝试用我,而不是我们
- 丢掉可能,短暂这样的词
- 成人自己搞砸了用户的计划
生产坏境的变更
- 变更识别记录
- 变更的准确日期和时间
- 将要发生变更的系统
- 实际的变更
- 变更期待的结果
- 变更人员的联系方式
AFK变更日志
日期,时间,系统,变更,期望结果,执行人变更管理
- 提出,
- 批准
- 计划
- 实施
- 验证
- 报告
回滚计划和脚本