《架构与未来》摘要(二)

一、

    管理和领导有许多区别,但两者都很重要。如果领导是承诺,那么管理就是行动。如果领导是目的地,那么管理就是方向。如果领导是激励,那么管理就是动机。如果领导是拉力,那么管理就是推力。

 

    管理包括度量活动、目标评估、指标制订。

    因此,在AKF我们实践了5-95规则:即用5%的时间制订一个充足、保守和详细的计划,同时承认这个计划不是完备的,把其余95%的时间投入到应急演练,以应付突发事件。(没有万全的作战计划)

   组织的产出取决于个人的产出和团队的规模。效率是高性价比可扩展性的一个组成部分,用来度量以同样的投入取得更多或者更好的产出,或者以较少的投入取得更多的产出。人的扩展性是与个人、规模和组织相关联的。

 

    组织的扩展性在很大程度上依赖于人才,而这又取决于人均产出及在企业文化影响下行为的一致性。设计团队意味着要找到符合组织愿景和使命所需要的合适人才。

 

    在所有的面试中,最常被忽略的是企业文化的适应性。

    1)清楚地列出公司对人才的理念,这些理念也许印在工卡的背面或可以在公司内网上找到。围绕这些理念出一些问题,然后发给参与面试的团队成员。

    2)选取团队里表现好,而且和公司在文化、信仰上匹配度高的人做面试官。

    3)面试后,召集所有的面试官讨论候选人对问题的答案和大家对此人的感觉。

 

    培养的目的是让团队成员成长,以满足股东的期望。这包括指导、赞扬、正确地掌握技术或方法、调整薪酬和股权以及任何使员工更强大和更优秀的办法。虽然你必须遵守公司淘汰员工的有关要求,但是要想办法尽快淘汰妨碍大家实现目标的人极为重要。越早淘汰这些表现差的人,就能越快找到合适的替代者,让团队向前发展。

 

    如果团队要持续提升或改善表现,那么久需要不断的进行下面三项活动:

    1)播种:增加新的、更好的人才。

    2)施肥:培养和发展要保留的人。

    3)除草:淘汰掉表现不佳的人。

    评价一个员工应该从“成绩产出”、“行为”两个方面:

    1)对于“成绩产出较差”或者“行为较坏”有其一者,先培养,如果不成功,则淘汰。

    2)对于“成绩产出较差”且“行为较坏”,立即淘汰。

    

    “不去度量就无法改善”,如果希望为股东创造价值,唯一的证明方法就是度量。我们确信要营造一种企业文化,支持度量任何与创造股东价值相关联的活动。然而,对于可扩展性,我们认为要按照某些主题来度量。通常我们建议度量成本、可用性、响应时间、生产效率以及质量。

    1)成本:团队规模,软硬件开支等,应该包括相关联的收益。

    2)可用性:系统稳定的可用时间,且无扩展性问题,比如99.9%。

    3)响应时间:系统响应时间,影响SLA的核心标准。

    4)生产效率:达成一个任务目标时,对人力的评估,比如“10天/20人”。

    5)质量:通常体现在故障级别、错误率等。

 

二、

    由于大多数的非技术管理人员的职业生涯缺乏相应的技术教育和经验,技术人员和其他的业务主管被经验的鸿沟隔开了。

    技术人员必须负起跨越鸿沟进入业务领域这一责任。

    为获得对扩展性的理解和支持,必须要用业务的语言来说明任务以使业务主管能够理解。

    计算中断和宕机时间的代价是证明需要把企业文化关注在扩展性上的有效方法。

 

三、

    “关注过程”、“好的过程产生好的结果”、“过程保证成功”...

    过程有三个主要的目的:助力团队和员工的管理,规范员工执行重复性任务时的行为,把员工从日常琐事中解放出来,专注于更大和更多的创意。假如过去没有危机管理或容量规划的过程,没有在复杂性和可重复性方面与团队匹配的过程,就不能有效地扩展系统。

 

    ITIL定义了事故管理过程必不可少的活动:

    1)监控和记录事故

    2)分类和初步支持

    3)调查和诊断

    4)解决方案和恢复服务

    5)关闭事故

    6)事故所有权、监控、跟踪和通信

 

    设计一个可以被监控的平台是必要的。

 

四、

    尽管我们相信为一个项目增加资源要有度,否则会减少回报,甚至带来负面影响。在危机发生时,我们要在最短时间内解决问题,而不考虑资源的回报和效率。在处理危机时,不要考虑产品的未来交付问题,因为这样的考虑和导致的行为会增加危机持续的时间。相反,要身体力行,出现在危机现场,屏蔽任何干扰。

 

    危机是不好,但是如果能够妥善处理可以给公司带来长期的利益。针对一个或者一系列的危机,如果公司能够因此而改变过程、文化、组织结构和架构,就能够从危机中收益。在这种情况下危机就是催化剂。

    我们的工作是要尽可能避免危机。但当危机发生时,我们必须牢记一句格言:“浪费危机是一件可怕的事情”。这句格言指出了一个强烈的愿望,要通过事后处理,分析尽最大可能从危机中学习,以此改善我们的人员、过程、技术和架构。

 

    采用新的过程确保所设计的系统具有扩展能力,强化工程团队在高可用、扩展性架构和设计方面的意识。

    在危机情况下,如果没有统一的管理,大量来自不同组织的人会造成混乱。这种混乱会造成恶性循环,延长危机事件,甚至优于某人以不明智的行为恶化危机。事实上,如果你不能有效地管理危机中的各部分力量,你就要尽可能少用人。

 

    有能力成为管理混乱环境的人有着相当独特的性格。与领导一样,有些人天生就有能力在混乱中建立秩序,而其他人则需要时间来学习这项技能。更多人在危机发生时即没有欲望也没有技能来领导。把这些人放在危机管理的领导地位可能是灾难性的。危机管理团队绝对需要懂技术的人,但未必是会议室中技术水平最高的人。这个人应该能够用他的技术基础提出与危机相关的问题并评估答案。问题管理经理不需要是主要的问题解决者,而需要在危机中有效地管理主要的问题解决者所遵循的过程。我们需要这个人“内在”有令人难以置信的平静,而“外在”有说服力。这可能意味着问题管理经理有种自然的亲和力,或可能意味着他不害怕在房间内或电话会议里大声吆喝,以引起人们的注意。

 

五、

    确定产品预留空间的目的是要明白,相对于预期需求,从系统容量的角度看,目前产品的能力处在什么状态。预留空间可以回答“在系统开发出现问题之前,系统还有多大的容量”这个问题。在产品开发周期的几个阶段,预留空间的计算非常有用。

(第五章~第十一章)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值