部分笔记内容引自《<凤凰项目 一个IT运维的故事传奇>读后感》
1. 主人公比尔担任IT运维副总裁期间的工作阶段:
阶段1 - 无人遵守工作流程,项目一片混乱
阶段2 - 试图终止混乱局面,重新规范流程
阶段3 - 尝试解放约束点
阶段4 - 专注核心项目,冻结额外项目,偿还债务
阶段5 - 控制流入的工作项目
阶段6 - 从企业顶层目标出发考虑问题,做真正有用的事
阶段7 - 优化流程和工具,创建反馈回路,形成文化
2、四种工作类型:
一个公司的IT从事着四种类型的工作:
S1、业务项目:公司的业务举措;
S2、IT运维项目:包含业务项目衍生出的基础架构或IT运维项目,以及内部的改进项目(例如创建新环境以及部署自动化);
S3、变更:经常由上面两种工作引起,对现有的应用程序、系统、设备等进行操作,并可能对服务产生影响;
S4、计划外工作:操作事故以及操作问题等。
3、三步工作法:
作者从埃瑞克那里学会了三步工作法,逐渐发现工作中的不足之处,并用其指导改善公司的IT业务流。三步工作法很好的阐明和指导开发运维的流程与实践的价值观。文中对三步工作法进行了一个高度的概括,有助于我们记忆。但最好的践行方式,是经过反复练习巩固,并在工作中不断去学习了解,实践加理论才是正道。
第一工作法,从开发到IT运维再到客户的整个自左向右的工作流。通过建立完整的持续构建、集成以及部署和严控半成品,帮助我们形成一条迅速、可预测、持续不断的计划内工作流、从而向业务部门交付工作价值,同时尽可能降低计划外工作的影响和破坏,逐步提供稳定的、可预期的、安全的IT服务。
第二工作法,价值流各阶段自右向左的快速持续反馈流,放大其效益以防止问题再次发生,或者更快地发现和修复问题。加速问题的反馈,可以缩短及放大反馈环路,在源头上解决问题,避免问题逐步放大。一旦问题反馈不及时,后续基于此产品的工作,只会让错误成倍的放大。此外,合理的反馈流可以减少意外工作的干扰。
第三工作法,关于创造公司文化,该文化可带动两种风气的形成。当成功的构建了第一和第二工作法,下来就是需要增强产品信心,营造一种勇于创新、冒险的环境,高信任度的文化。这就要不断给系统施加压力,不断强化学习并加以改进,比如反复的故障演练、反复的安装部署等。
4. 约束点
在瓶颈之外的任何地方进行的改进都是假象。
高德拉特(目标)五个聚焦步骤:
- 第一步是确认约束点,直到确定那的确是整个部门层面的约束点,对非约束点的任何改进都只是幻觉,得不到实际任何价值;
- 第二步是利用约束点,寻找突破这些约束的办法,确保不让约束点浪费任何时间,永远不要让约束点迁就别的资源而干等着,而是应该专注于IT运维部对当前所需完成工作中优先级最高的那一项,一直都要这样;
- 第三步,使企业或部门的所有其它活动服从于第二步中提出的各种措施;
- 第四步,具体实施第二步中提出的措施,使第一步中找出的约束环节不再是整个部门的约束点;
- 第五步,回到步骤1,别让惰性成为约束,持续不断地改善;
有趣的言论:
- 我完全不想加入副总裁的行列。副总裁们整天做的就是互发PPT
- CIO代表着“Career Is Over”。
- 程序开发人员比网络维护人员更可怕,你要是能找出一个不给生产体系添乱的开发人员,我就能给你找出一个往镜子上哈气却不会起雾的人。
- 比一名开发人员更危险的就是开发人员与信息安全部门的人联手,这样的组合把给我们添乱的动机、手段和机会都弄齐全了。
实践:
问题
中间件运维工作中,安全补丁升级是一个非常耗费精力和时间的工作。
仔细思考,安全补丁升级从来都是被列为计划外工作,由安全中心漏扫或者重大漏洞披露驱使中间件专业评估、分析、协调整改。即缺乏与安全中心、应用专业联合协调的统一的补丁处理机制。
措施
工作类型转变:考虑到计划外工作的伤害程度,有必要将其纳入计划内工作范畴进行统一规划,并建立跨专业的机制,对流程制度操作形成统一认识和约束,从而有效应对其冲击。
识别工作流:
- 安全漏洞发现流程: 安全漏扫->漏洞报告->漏洞评估分析->整改或完成;
- 整改流程:与应用沟通->测试->生产变更
聚焦:
识别约束点:
- 漏洞评估耗时较多,建议安全中心提供的尽量详细,服务厂商定期和按需提供
- 评判漏洞业务影响的规则不明确,经常需要反复商讨
- 与应用沟通耗费大量时间
建立共识:与安全、应用就相关策略建立共识
反复实践并加以改进