第五章 IT服务部署实施
目标
- (1)协调并组织组成服务的所有要素,使用合适的技术,在满足规划设计环节的要求和限制的前提下,在可接受的时间、成本和质量的标准内,确保服务在生产环境里的顺利发布;
- (2)对于复杂的IT服务部署实施,标准化部署实施过程,提升新服务或变更服务的交付质量;
- (3)在IT服务部署实施期间,确保客户、终端用户及服务团队等相关方的满意度;
- (4)确保新服务或变更的服务与客户的业务组织、业务过程的顺利衔接;
- (5)IT服务部署实施为IT服务运营过程中不同客户的差异化服务需求提供服务交付基线,使得服务团队可灵活有效地调整服务交付过程,满足不同客户的服务需求及内部管理需求;
- (6)IT服务部署实施阶段会全面考虑IT服务运营过程中的风险,提前识别、计划和规避风险的措施,保证提供不间断的、可用的IT服务运营服务。
IT服务部署实施要素 1-人员要素部署实施
- (1)外部招聘和内部调岗;
- (2)建立培训教材库及知识转移方法:
- 培训教材内容(包括但不限于):
①技术。如数据库知识、虚拟化知识等;
②管理。如质量管理、领导力等;
③过程。如IT服务管理过程等;
④资源。如IT服务工具、服务台手册等。
IT服务部署实施要素 2-资源要素部署实施
- (1)知识库内容初始化
- ①来源:
1)由信息技术支持工程师提供;
2)从过往的事件和问题的处理日志中提炼;
- ②审核;
- ③发布。
- (2)工具部署、使用手册与相关制度
- ①工具部署前做好工具的测试,以测试结果作为重要的部署决策依据;
- ②规划好工具上线后的试运行阶段,包括试运行的周期、试运行的目标和结束标准;
- ③依据风险级别与影响度范围,决策工具部署上线是否采用阶段式部署;
- ④与工具相关的知识应从开发团队或工具厂商处有效转移给工具的IT服务团队,包括各类工具的使用手册等。
- (3)备件库建立与可用性测试
- (4)服务台管理制度的初始化
- ①服务台中各岗位的角色与职责;
- ②服务台的主要工作流程;
- ③记录事件与服务请求的具体要求;
- ④事件与服务请求分派的原则;
- ⑤事件回访的相关规定与要求;
- ⑥服务台的绩效考核指标。
IT服务部署实施要素 3-技术要素部署实施
- (1)知识转移
- 目的:提高IT服务技术支撑能力,降低风险,缩减成本,提升效率。
- 内容:
①历史运维资料
1)相关工作界面和人员职责说明书;
2)内外部支持信息(开发商、厂商、业务部门、公司内部相关部门)。
②基础架构资料
1)系统部署和网络物理拓扑;
2)系统架构说明:软/硬件配置;
3)系统数据备份与恢复操作说明书;
4)系统应急、容灾处理方案(如集群切换和恢复);
5)系统日常运维操作手册。
③应用系统资料
1)应用系统测试报告;
2)应用系统使用手册;
3)应用系统需求和设计文档;
4)应用系统安装配置手册;
5)应用版本说明(含与其他系统的依赖关系说明、已知错误列表及对应的临时措施等)。
④业务资料
1)业务架构图(业务功能模块在系统中的分布);
2)业务流程(系统交互、工作流说明、业务功能说明、业务对象说明);
3)业务场景说明(前台业务高峰说明、后台关键作业时间周期);
4)业务培训资料;
5)业务运维文档(业务问题FAQ、业务问题诊断)。
- (2)应急响应预案的制订与演练
- 1、IT系统重大突发事件
①自然灾害引起的对IT系统的灾难性破坏;
②网络通信设备、通信线路故障导致IT系统的重大故障;
③电源电路以及机房等基础设施故障导致IT系统的重大故障;
④IT系统数据库、系统和存储、中间件故障导致的重大系统性故障;
⑤IT系统发生网络攻击破坏、计算机病毒传播或被利用从事违法犯罪活动等引发的重大安全突发事件;
⑥应用系统发生重大故障;
⑦组织认为应采取应急机制的其他IT系统重大突发事件;
- 2、应急演练原则
①结合实际、合理定位;
②着眼实战、讲求实效;
③精心组织、确保安全;
④统筹规划、厉行节约。
- 3、突发事件等级划分
①特别重大突发事件(I 级)
系统性故障造成20%~60%的集中的基础、核心、关键的应用系统不可用,且在24小时内无法恢复;
或60%以上集中的基础、核心、关键的系统不可用且12小时内不可修复;
②重大突发事件(II 级)
系统性故障造成20%~60%的集中的基础、核心、关键的应用系统不可用且在12小时内不可恢复;
③较大突发事件(III 级)
关键业务全国性的中断,且预计恢复时间大于6小时、少于12小时;
④其他造成区域性业务中断的故障
造成区域性业务中断的故障,恢复时间小于6小时的IT事件按照日常事件处理流程执行。
- 4、组织指挥体系及职责
①指挥小组职责
1)指挥、协调集团公司及系统内部组织的信息系统突发事件处理工作;
2)启动信息系统应急预案;
3)协调行政工作和后勤保障资源;
4)作为与组织管理层和业务部门沟通情况的接口;
5)决定其他重大事项;
6)通知或召集相关的恢复小组负责人;
7)根据指挥小组的指示,协调处理其他事务;
8)负责组织本预案的维护、演练和管理工作。
②IT恢复小组职责
1)IT恢复小组负责IT环境的恢复工作,包括基础设施、应用系统和其他IT环境;
2)IT恢复小组组长负责通知或召集相关的恢复小组组员。
- 5、应急响应演练
①演练启动
②演练执行
1)演练指挥与行动;
2)演练过程控制;
3)演练记录。
③演练结束与终止
1)演练结束与终止的程序;
2)演练结束条件:方案演练目的、内容、程序都已按要求演练完毕;
3)演练终止条件:出现真实突发事件,需要参演人员参与应急处置时,要中止演练,使参演人员迅速回归其工作岗位。
④应急演练评估与总结
1)演练评估;
2)演练总结。
⑤成果运用
⑥文件归档与备案
1)文档保存期限通常为6年。
⑦考核与奖惩
- (3)SOP标准操作规范
- 目的:制订SOP对某一程序中的关键控制点进行细化和量化。
- 作用:
①将企业积累下来的技术和经验记录在标准文件中,以免因技术人员的流动而使技术流失;
②使操作人员经过短期培训,快速掌握较为先进合理的操作技术;
③树立良好的服务形象,取得客户信赖与满意;
④SOP是贯彻标准化作业的具体表现,实现服务管理规范化、服务流程条理化、标准化、操作的形象化、简单化;
⑤SOP是系统规划与管理师最基本、最有效的技术管理手段;
⑥可以根据业务与技术发展需求,实现快速迭代。
- 编写要点:
①在人力、财力、物力等资源允许的范围内可以做到;
②IT服务人员都能看懂,且每个人的理解都相同;
③效率最高和成本最低,并识别出风险关键点;
④SOP正式发布前要经过测试与评价环节;
⑤可以根据业务与技术发展要求,实现快速迭代。
- (4)技术手册发布
- ①审核;
- ②存档;
- ③发放。
- (5)搭建测试环境
IT服务部署实施要素 4-过程要素部署实施
- (1)过程与制度发布
- (2)过程电子化管理
- ①过程管理电子化工具与其他工具的互联互通,如呼叫中心系统、集中监控系统;
- ②规划设计中的过程KPI如何通过电子化工具直接获取,并形成所需的报表;
- ③如何在电子化工具中实现各个过程与其他管理过程之间的接口;
- ④过程与知识库的关联关系,如问题导入知识库的方法等。
- (3)过程数据初始化
- ①组织基础信息;
- ②人员基础信息;
- ③过程角色;
- ④客户信息;
- ⑤历史信息,如最近两个月的事件单等;
- ⑥其他信息,如事件管理过程提醒时间等。
- (4)体系试运行
- ①管理目标达成情况;
- ②客户满意度;
- ③服务工具使用效果。
IT服务部署实施计划阶段
- 目的:确保部署实施的过程在有序、可控的条件下顺利进行。
- 干系人共识:
- (1)IT服务部署实施的目标;
- (2)IT服务部署实施详细的过程、时间及其投入;
- (3)IT服务部署实施如何实现所要求的要素;
- (4)明确IT服务部署实施过程中需要了解项目进展信息的人员,确定相关的展现方式与时间。
- 活动:
- (1)计划沟通
①在与客户的沟通中,着重了解客户的期望,以及客户能够提供何种资源上的支持;
②在与规划设计环节负责人的沟通中,着重了解规划设计的要素,确保无遗漏,避免出现与规划设计差距较大的情况;同时要详细了解规划设计环节中已经考虑到的风险控制机制,以确保在部署实施阶段将其导入生产环境;
③在与交付团队负责人的沟通中,着重了解其服务支持和提供的能力,以确保为其计划培训时间与培训内容,同时依据其服务能力定义合理的服务目标和实施里程碑。
- (2)计划制订
①部署实施阶段的责任人;
②角色与职责;
③运维项目情况;
④各阶段的具体工作任务与负责人
1)IT服务部署实施启动会;
2)服务团队组建计划;
3)服务团队培训与知识转移计划;
4)服务工具采购、安装部署、测试、初始化与上线计划;
5)核对服务目标;
6)核对服务目录;
7)设定服务模型;
8)客户化服务管理过程;
9)设定过程绩效指标;
10)初始化服务文档体系与文档管理规范;
11)初始化配置管理数据库(CMDB);
12)客户化服务规范;
13)开发工作指导书和标准操作规范;
14)编写服务计划;
15)服务发布会/部署实施总结会。
⑤交付物列表
1)服务工具上线计划;
2)服务工具测试计划;
3)服务工具测试报告;
4)服务工具上线报告;
5)服务工具操作指南;
6)服务工具配置手册。
⑥交付物验收标准
⑦对客户的要求(客户的参与)
- (3)计划评估与确认
- (4)计划修订
- 关键成功因素:
- (1)明确IT服务部署实施阶段的责任人;
- (2)明确IT服务部署实施范围、里程碑、交付物,以及交付物的验收标准;
- (3)对IT服务能力和资源合理准确的预测;
- (4)IT服务连续性的保障。
- 应急能力响应所需的要素:
- (1)风险评估;
- (2)应急响应的触发、通知机制;
- (3)制订应急预案;
- (4)成立应急响应组织,明确由何人负责启动该应急预案;
- (5)恢复服务所需的行动步骤和相应的责任人;
- (6)应急预案的培训与演练;
- (7)日常监测与预警。
- 可能的风险:
- (1)IT服务部署实施计划的完整性
- (2)IT服务部署实施计划的条理性
①服务工具未上线即启动服务测试;
②未定义服务目标即开始客户化服务管理过程;
③过程与规范未开发完成即启动团队培训;
③服务运营团队未组建完成即开始进行知识转移。
- (3)IT服务部署实施计划本身的可用性
①可操作性
指所有的服务组件或服务资源,可以支撑在规定时间内的计划实施,且无职责的盲区或职责的重叠。
②可交付性
指计划的输出物是明确的、合理的,不超出能力范围,且责任人能够清晰地理解交付物的要求。
③可控制性
指各项计划不仅有责任人,还有专人负责全程监控、及时预警,并设有专人对交付物的质量做初步验收。
- (4)IT服务部署实施交付物的可验收性
- (5)与IT服务规划设计和IT服务运营的吻合性
IT服务部署实施执行阶段
- 目的:协调各种资源,按照IT服务部署实施计划的要求输出相应的交付物,使包括客户、第三方供应商、项目团队等在内的所有项目干系人,在有效地执行跟踪、评估检查和变更控制下,按照服务级别协议和项目计划,持续改进实施项目。
- 干系人共识:
- (1)开展项目的原因和目标;
- (2)项目的交付物及其约束条件;
- (3)项目的交付方式、交付时间及其投入;
- (4)项目的范围;
- (5)项目初步实现所要求的条件;
- (6)项目所面临的风险;
- (7)对部署实施计划所需资源的验证;
- (8)与项目干系人做计划的正式声明和沟通,对各种资源提出正式的要求;
- (9)角色和职责包括:成员角色、权利、职责和能力;
- (10)项目的组织结构图;
- (11)人员配备管理计划;
- (12)发现和解决问题相关的技术。
- 活动:
- (1)按规划开展活动,以实现项目目标,创造项目的可交付成果:
①召开部署实施启动会,正式声明部署实施的启动;
②与项目干系人正式地对部署实施计划做沟通,特别是确认各角色与对应的职责;
③验证资源准备情况。
- (2)管理、培训、配置运维团队成员;
- (3)验证、获取、使用和管理资源;
①知识库;
②面向服务的配置管理数据库(CMDB)。
- (4)执行已经计划好的过程、方法、标准;
- (5)可信赖的发布管理机制;
①发布计划;
②系统测试(包括已知错误的收集);
③实施与部署计划;
④回退计划;
⑤验收机制;
⑥系统说明书。
- (6)IT服务连续性管理机制;
- (7)IT服务回顾机制;
①服务合同执行情况;
②服务目标达成情况;
③服务绩效(服务级别协议)与成果;
④服务范围与工作量;
⑤客户业务需求的变化;
⑥本周期内遇到的特殊或疑难问题;
⑦本周期内的服务运营团队的各项绩效指标总结;
⑧下周期工作计划安排等。
- (8)满意度管理机制;
- (9)标准操作程序(服务作业指导书);
- (10)IT服务质量计划;
①项目组内部的抽检机制;
②定期抽检机制;
③IT服务质量体系的内部审计、管理评审或外部审计,检查其服务管理过程是否在持续优化与改进,是否可以支撑其服务目标的达成等。
- (11)特有的过程、专有的规范。
- 关键成功因素:
- (1)分配项目任务;
- (2)评估项目进展;
- (3)发现项目问题;
- (4)检查项目问题;
- (5)评估项目阶段状态;
- (6)纠正项目问题;
- (7)汇报项目问题;
- (8)控制项目变更;
- (9)管理项目交付物;
- (10)服务目标——清晰化、全面化;
- (11)标准操作程序(或服务作业指导书)——标准化、规范化;
- (12)IT服务运营培训——有效性、及时性;
- (13)过程绩效指标——SMART;
- (14)管理项目资源。
- 可能存在的风险和控制:
- (1)客户期望管理出现问题;
- (2)相关资源的能力不足;
- (3)交付物认知水平不一致;
- (4)服务级别协议汇总服务范围不够明确,使得项目范围、成本、进度等可能发生较大偏差,甚至导致项目无法完成;
- (5)项目实施过程中服务范围发生变化,与约定服务范围冲突,可能加大服务技术难度,增加投入成本;
- (6)由于资源不够或项目成员承担过多,在项目计划中所计划的资源得不到保证,项目任务无法按时、按质完成;
- (7)项目团队成员职责分工不明确,导致项目在执行过程中接口混乱、工作量加大、沟通和管理成本成倍增加、项目任务出现盲区;
- (8)成员身心问题,出现抱怨,不能愉快投入工作,任务脱节,项目实施不规范,项目质量出现问题;
- (9)项目组内部沟通不力,造成项目问题积压,导致项目后期出现更大的问题;
- (10)第三方供应商交付了不符合要求的产品,使得项目无法正常执行;
- (11)服务目标、测量手段、服务能力和成熟度;
- (12)配置管理的广度与颗粒度。
IT服务部署实施验收阶段
- 目的:取得干系人对部署实施阶段交付物的认可,同时对IT服务是否可以稳定且持续地运营做验证。
- 关键要点:
- (1)服务级别协议中的约定目标都已实现;
- (2)规定的服务交付物可合规交付,并被客户所验收;
- (3)解散部署实施团队并释放资源,前提是交付团队及相关管理机制可平滑过渡到运营阶段;
- (4)总结并记录部署实施中的经验。
- 活动:
- (1)IT服务部署实施期报告
①部署实施计划的完成情况;
②资源使用情况;
③交付物列表;
④部署实施期的工作总结;
⑤部署实施期的重大事件回顾(如计划的变更);
⑥对服务运营期的建议。
- (2)IT服务部署实施回顾
①时间点与里程碑的达成情况回顾;
②对各方面资源的配合情况回顾;
③对交付物的特殊说明;
④部署实施期间的服务指标完成情况;
⑤正式地声明进入服务运营期。
- (3)交付物验收
- 关键成功因素:
- (1)客户的满意度;
- (2)客户对服务质量的直接感知;
- (3)服务级别协议的完成情况。
- 可能存在的风险和控制:
- (1)服务级别协议汇总的验收准则或标准不够清晰,导致项目缺乏准确的依据来进行验收;
- (2)服务验收的准备不充分;
- (3)未提供部署实施期报告;
- (4)客户对主管领导或主管部门组织结构发生变动后,项目收尾无法启动或进行;
- (5)项目文档资料不规范,导致客户对项目质量存有疑虑,使部署实施无法验收。