高效的告警事件管理,原来可以靠它

8e4a93678f19c8a8f0004a21ce9dc6e4.png

6月10日下午,云和恩墨成功举行了线上的产品发布会,智能运维产品总经理郑隐在《Bethune:DBA的效率工具》主题分享中,为观众呈现了大道至简的“工具之美”。

下面来一起看一看,如何实现高效的告警事件管理吧~

(听说加了BGM的小视频看起来更带感哦~)

市面上多数的监控产品,仅仅做到了告警触达,而不会更进一步思考如何能从告警信息中提取DBA想要了解的数据。作为一个监控产品,如果告警信息太多,像雪花一样刷屏的时候,DBA该怎么办?

9639ef4d259d6ce290749d09a564f14d.gif

Bethune X做了告警的降噪、聚合和告警事件状态的自动扭转。

一起来看个例子:


策略:当某主机 CPU >  80% ,触发告警。

降噪:对于轻微波动就告警的情况,可以配置触发函数来降噪,即减少频繁告警。

f8863e6765d4636465d20fde408316a5.png

2a85225dd6509a51ea30701707b0d7cd.gif

触发告警:该事件再次超过阈值,并持续告警,即为一个「持续中」的告警事件,需要DBA关注。

dad8099b4d6e013dabd9a82c97ddc5a3.gif

状态扭转:告警策略中设置了检测事件状态变化的判断次数,状态变化超过了设置的判断次数,则事件由「持续中」变为「已恢复」或「已过期」,DBA无需再对其关注。此处判断次数为3次,即当事件连续三次低于告警阈值,则状态变为「已恢复」。

ecbf27c0c24fea4bf98ff20cbd7ca61a.gif

总结


Bethune v1.4重新定义了告警事件管理的方法:

一个告警事件有策略、对象连续性三个边界,告警事件则定义了持续中、已忽略、已恢复过期四种状态。

  • 当某事件持续告警时,状态为「持续中」,需要DBA关注处理;

  • 当对「持续中」的事件暂时忽略,状态为「已忽略」,待忽略期过后,状态重新变回「持续中」,提醒DBA处理;

  • 当告警事件由「持续中」转变为「已恢复」或「已过期」,则DBA无需过多关注。

事件看板则是对告警事件的集中管理入口:

  • 矩阵树图展示告警事件的状态分布,DBA快速定位关注的告警类别;

  • 筛选出事件详情列表,根据状态快速聚焦关键告警;

  • 对于关注的告警通过下钻功能,进一步分析,找出问题根因。

36f508e519d852ee280b030a46945d8b.gif

小伙伴们如果对Bethune X v1.4感兴趣,可联系marketing@enmotech.com,我们提供在线的功能试用,欢迎来看!

数据驱动,成就未来,云和恩墨,不负所托!


云和恩墨是全球化数据资产端到端解决方案提供商,致力于将数据思维带给每个组织、每个人,构建数据驱动的智能未来。我们在数据服务、运维平台、数据智能、教育培训等领域为企业和个人提供可信赖的产品、解决方案和服务,与业界厂商广泛合作,围绕用户需求,持续为客户创造价值、为行业培养人才,激发数据潜能,为成就未来数字化企业和数据人才而不懈努力。

云和恩墨坚持围绕数据时代客户面临的挑战持续创新,不断加大研发投入,持续完善贯穿业务智能、开发管控、云管平台、分布式存储和基础运维的端到端产品和服务,助力企业和个人成功。735a04c45ec08ccddae00018aa2b85e4.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值