· 案例背景
 
  企业IT系统越来越多,网络、设备和产品越来越复杂,业务越来越依赖于稳定可靠的系统运行,公司内部和外部用户对IT部门的支持服务和协调管理也提出了更高的要求。此时IT部门如果缺乏快速有效的协调机制和必要的辅助管理工具,就会出现“救火队式”的混乱局面,其主要表现如下:
  ·被动响应式的工作方式。
  ·很难及时发现和预见问题的发生。
  ·问题出现后,很难快速、准确地找到根本原因,并及时地找到相应的人进行修复和处理。
  ·问题找到后,缺乏流程化的故障处理机制。
  ·重复、丢失、忘记用户的请求和信息。
  ·支持过程总是被打断和干扰。
  ·关键人员的工作负载过重。
  ·缺乏过程和变化的跟踪记录。
  ·IT支持部门面临不断改进服务和降低成本的压力。
  ·资源和人力成本计算工具匮乏。
  ·服务请求的响应时间和质量无法衡量。
  ·决策基于“我认为”而不是“我知道”。
  结果造成IT部门整天疲于奔命,却仍被投诉,无法满足服务时效性和稳定性的需求。这种工作模式下的IT资源管理,不仅IT部门吃力不讨好,而且也无法发挥IT系统的整体性能和功能。
 
· 方案介绍
 
  在中国移动集团公司项目中,Mocha BSM实现了以下功能:
  端到端BSM(Business Service Management)为企业整合不同监控系统的数据和事件,以清晰的仪表盘形式,展现各种指标状况,最终帮助企业领导实现IT规划与决策。通过Mocha BSM的服务定义,系统管理员把所有的网络,主机和应用等都能定义为服务,方便移动领导通过BSM Dashboard以业务视角来了解企业IT系统,而不是试图理解IT系统技术上的细节。
  通过BSM Dashboard,移动集团公司领导能更轻易地通过KPI指标理解现有企业IT系统的可用性和性能状态,这包括MTTR (平均恢复时间Mean Time To Repair)和MTBF (平均无故障时间Mean Time Between Failure)等KPI指标。
  我们也实现了移动集团公司内部的服务水平管理(Service Level Management),对×××服务以及相关系统提出了具体的反应时间的要求以及SLO(Service Level Objective)数值。
 
read-case-cmcc-01.jpg
  领导可以通过SLA Dashboard了解×××服务的现有状况以及符合SLA的状况。一旦发生违反SLA,比如×××服务反应时间过慢,系统管理员就会接受到短信和邮件通知。为了确保×××服务的服务水平,项目组特地设置SLO违反警告,一旦某一项SLA指标接近危险水平,系统管理员也会收到报警,提供了充分时间给系统管理员做好准备,避免违反SLA,导致×××服务的客户体验受影响。
                          
read-case-cmcc-02.jpg
  通过Mocha BSM的报告订阅,IT系统管理员或者领导都能定期获得×××服务的状况,这包括SLA满足的情况以及×××表现的趋势。
  IT部门也能定期通过Mocha BSM的评审对×××服务进行内部的评审,并能对SLM做出未来的规划和优化。
read-case-cmcc-03.jpg
  客户领导日理万机,时间非常宝贵,所以IT部门对他们提供的服务,更加不能出现差错。但是,往往IT部门都是被动的解决领导遇到的IT问题,都是事后领导先发现问题,才硬着头皮解决。项目实施的Mocha BSM VIP服务就充分地解决了这个问题。VIP服务会监控领导使用×××服务的反应时间,一旦反应时间不能满足SLA的定义,系统管理员会第一时间知道,并且能主动解决领导的问题。
read-case-cmcc-04.jpg
  项目也通过Mocha BSM的业务流程监控对客户的Lotus OA的业务流程进行监控。这包括从企业、部门、个人角度来统计业务流程的效率。
read-case-cmcc-05.jpg
 
  项目也实现了×××服务端到端的反应时间监控。以前,系统管理员最大的头痛是不能对反应时间慢等问题进行定位,因为×××服务牵涉了几个不同的系统:
  ×××系统端到端监控快照。
  比如客户的×××服务牵涉了×××软件,Radius认证服务,Oracle数据库,应用服务器,短信应用和短信网管等系统。
read-case-cmcc-06.jpg
  现在通过Mocha BSM的端到端反应时间监控,系统管理员能够根据VIP或者普通用户查询某个用户×××服务登入反应时间的历史纪录。一旦有相关用户投诉,系统管理员能够很快地找到相关资料,以及定位问题的根本原因。系统管理员也能把×××服务相关的系统信息关联上,马上就能看出当时系统慢是不是因为CPU或者内存原因。点击其系统历史纪录,就能看到这个现象在过去数个小时内是持续性还是昙花一现。
  应用进行监控,项目也实现了×××应用、Lotus Domino和Lotus Mail应用的监控。
  通过Mocha BSM应用监控,系统管理人员更加容易地对系统进行可用性和性能管理。
 
· 功能亮点
 
  在中国移动集团公司的Mocha BSM 实施项目具有以下特点:
  允许集团公司的维护队伍达到80/20效果,花20%力气达到80%效果。移动领导日理万机,时间比较宝贵,IT系统必须有效支撑移动领导的公司决策过程。通过Mocha BSM的端到端的反应时间与事务监控和VIP服务,系统管理员可以主动预防领导登入×××服务慢等问题,提高公司领导对IT部门的满意度。
  实现了端到端BSM,现在IT部门领导也不需要像过去那样需要了解技术细节,他们只需要通过BSM Dashboard,SLA Dashboard等仪表盘,能够更好掌握IT部门服务营运状况。
  以前,很难界定IT部门的表现的好坏,因为没有数据支持或者证明。但是现在通过服务水平管理 (SLM),不但制定出领导与内部同事对×××服务反应时间的期望值,并且可以朝这个量化的指标努力,确保高的用户满意度。一旦×××服务质量有恶化的趋势,系统管理员也能第一时间获得这方面的报警,主动定位问题,排除问题。
  在实施Mocha BSM之前,移动集团公司已经买了Remedy和ITM等监控软件,但是Mocha BSM的高可兼容性,确保Mocha BSM和Remedy达到了事件整合以及和ITM做到了数据整合。这允许客户挑选各个监控领域最佳产品,但是又不需要担心产品之间整合等问题,而且保护了现有投资。
 
 
· 客户收益
 
  Mocha BSM产品,正是我们迫切需要的产品,它是先进的业务服务管理系统,提供了完善的自动管理、监控、统计分析等功能,现在IT部门的服务工作方式、工作内容有了彻底的改变。
 
更多相关信息,请点击 [url]http://www.mochabsm.com[/url]