Mocha BSM产品亮点——策略管理

业务需求与挑战
      企业即使已经使用了其他监控软件,在制定监控策略时,也经常会遇到下列场景:
• 无法批量设置资源的监控策略。
• 无法对同一资源的相同的组件采用不同的监控策略(设置不同的监控频度、阈值等)。例如,无法对一个Lotus Domino服务器的100个NSF数据库,或对一个IIS服务器的5个Web站点,根据NSF数据库或Web站点的重要程度的不同而设置不同的监控频度、阈值等。
• 判断指标状态时,无法设定指标超过阈值的连续发生次数,指标状态频繁改变会频繁触发事件/告警,最终导致“狼来了”的故事上演。
• 被监控的某资源在每天的某一特定时间段负载会很重,在该时间段采集指标无异于雪上加霜,但用户无法设定在该时间段不采集资源的监控数据。
• 只能按相对频度(例如每1小时),无法按绝对时间(例如每天19:00)采集指标。
• 无法设定事件是否产生,以及同一事件设置不同的级别与优先级。例如,同样是主机宕机事件,无法对企业的生产机与备份机引起的宕机事件设置不同的级别与优先级。
• 报警方式单一,例如,只提供邮件报警,没有短信、语音(通过自动拨打用户电话报警)等有效的报警方式。
• 没有报警升级,例如,数据库服务器不可用时,报警至数据库管理员,但24小时后数据库仍未恢复使用,无法报警升级至部门领导,从而不能使领导及时知晓并采取更强力度的措施。
        以上不够灵活的策略管理,大大限制了监控软件对企业的价值。
 
关键功能与亮点
Mocha BSM策略管理支持:
• 可将同一类型资源批量加入监控策略:一个监控策略包括使用策略的资源、指标定义、事件定义、报警定义,同一类型资源可批量加入该策略,以设置指标监控频度、阈值、事件、报警等。
product-ld-12.jpg

• 对同一资源的相同类型组件,可设置不同监控子策略:可对同一资源的相同组件设置多个监控子策略,以设置不同的指标监控频度、阈值、事件、报警等。如下图所示,可对一个Windows主机策略创建两个网络接口策略,以将其网络接口加入不同策略监控。
• 可设置指标阈值超标的连续发生次数,指标达到稳定状态时才会触发事件。
product-ld-13.jpg

• 可设置每个指标的不监控时间段,在被监控资源繁忙时不采集监控数据。
• 可按相对频度(例如,每小时)或绝对时间(例如,每天、每周、每月的某个固定时间)设置监控频度。
• 每个监控策略均可设置其每个事件产生与否,以及事件级别与优先级。例如,用户可将生产机与测试机加入不同策略,设置不同事件级别,即由生产机触发的主机宕机等事件的级别将会比由备份机触发的主机宕机等事件的级别更高。
• 支持设置多种报警方式,包括邮件、短信、语音(通过自动拨打电话,将报警的详细信息通知用户)、Mocha Alert(Mocha BSM的桌面报警客户端,报警信息即时在电脑桌面显示)。
• 支持报警升级,当指定的事件在指定的时间段内没有恢复或反复发生,则升级报警到更高级别的用户。
product-ld-14.jpg
 
我们给客户带来什么
• 快速、批量的设置资源的监控策略,大大提高工作效率
      对于相同类型的资源(例如,Windows主机),管理员可批量将其加入监控策略,而不必一个一个去设定采集频度、阈值等,节省了大量时间,并提高了工作效率。
• 根据业务需求,对同一资源的相同组件可采用不同的监控策略,轻重分开,突出重中之重
      例如,系统监控2个IIS服务器以及其上5个Web站点后,管理员可根据Web站点的重要程度的不同而设置不同的监控频度、阈值、事件级别、报警等。从而使重要Web站点拥有比次要Web站点更高的事件级别、报警等,突出了重中之重,便于管理员管理。
• 避免了因指标频繁改变而频繁触发事件、报警,保证用户收到的事件、报警都是有的放矢
      指标达到稳定状态才会触发事件报警。判断指标状态时,用户可设定指标超过阈值的连续发生次数,从而有效避免频繁触发事件/告警,做到有的放矢。
• 灵活的监控频度、不监控时间段的设定,满足更多监控业务需求
      用户即能按相对频度(例如每1小时),也能按绝对时间(例如每天19:00)设定指标的监控频度,还可以设定在某一时间段不采集指标。灵活的监控频度设定,可满足不同资源的多种监控需求。不监控时间段的设定,可保证不在被监控资源自身负载重时雪上加霜。
• 丰富的事件属性、灵活的事件设置,事件传达给用户的信息更加全面、准确
      管理员可设定事件是否产生,以及对同一类事件设置不同的级别与优先级,例如,同样是主机宕机事件,可对企业的生产机与备份机引起的宕机事件设置不同的级别与优先级,从而使事件传达给用户的信息更准确。
• 多种报警手段,当事故发生时,全方位、及时准确的通知用户
      用户可在策略中设置多种报警方式,当事故发生时,不仅以传统方式邮件方式通知用户,还可通过短信、语音(自动拨打用户电话报警)等多种报警方式,全面及时的通知用户。
• 在一定时间段内,事故仍没有解决,升级到更高层次用户,自动寻求更强的解决力度
      例如,数据库服务器不可用时,报警至数据库管理员,但24小时后数据库仍未恢复使用,可报警升级至公司领导。领导可调集更多资源,加大解决力度,从而迅速排解事故。
 
更多相关信息,请点击 [url]http://www.mochabsm.com[/url]




本文转自赖永锋51CTO博客,原文链接:http://blog.51cto.com/mochasoft/86410 ,如需转载请自行联系原作者
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值