如何抑制告警风暴？

最新推荐文章于 2024-06-19 16:30:04 发布

LinkSLA

最新推荐文章于 2024-06-19 16:30:04 发布

阅读量395

点赞数

文章标签：运维人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LinkSLA/article/details/126249529

版权

IT系统架构是一个聚沙成塔的过程，随着业务规模的不断扩大升级，IT架构的复杂程度随之提升。在庞杂的IT架构下，应用系统紧密相连，一个指标变化，就可能引起一场告警风暴。

如何行之有效地抑制告警风暴，高效处理告警问题，是运维必须面对的课题。

避之不及的告警风暴

冰冻三尺非一日之寒。

PUA运维的从来不需要领导，告警风暴就能轻松拿捏住。

如何抑制告警风暴？

如何从海量告警信息中快速归因？

如何快速定位告警问题？

如何沉淀告警处置经验？

如何快速恢复业务运行？

解决这些问题是一个优秀运维工程师的自我修养。

不得不说，运维工程师还是有点学习本能和天赋在身上的，即使是远离课堂，很少考试的职场人，也逃不过“学习基因”变得显性。接下来本着分析问题--解决问题的思路，和运维打工人一起探讨告警风暴的解题思路。

为什会产生告警风暴？

1、系统强关联

当用户访问应用系统，彼时系统将调用链路上多个IT单元，其中一个环节出现问题，就会导致业务故障。多个监控系统可能引发其他多个相关的告警，重复告警高达90%以上。

2、指标难设定

不同类型的指标，往往适合不同类型的模型和参数，无法单独设置模型和参数，分类效果不佳。阈值过高，容易漏报故障；阈值过低，容易产生大量无效告警，影响运维工作效率。除此之外，周期设置同样影响告警的有效性。

3、告警响应不及时

一个告警问题处理往往需要内部流转，同一处理进度被推送多人处理，则大大降低了工单的处理效率，并且造成人力资源的浪费。缺乏高效流程机制，加上大量重复无效的信息，造成告警处理延时或遗漏，产生告警风暴。

除此之外，历史遗留问题、工程师不解决或者是无法解决的告警问题也会产生告警风暴。

如何从根本上解决风暴？

综上，要解决告警风暴问题，首先要解决告警准确性和处理效率两大问题。

对于这两个需求，LinkSLA智能运维管家AI机器学习算法在应用上展示优异的效果。

1、多指标检测

内嵌多种检测模型，适用于多种形态的指标检测，通过对指标的趋势性、周期性等特征的捕获和学习，抑制告警风暴产生，提供更加精准的告警。

2、时序性指标检测

时序性指标异常检测，采用业内领先的机器学习算法，根据指标数据的历史变化规律，无需用户手动设定阈值，检测指标异常自动发送告警。

动态阈值支持各种监控和运维场景。包括（业务时间序列数据，基础监控时间序列数据等）的时序性指标异常检测，预制时序性指标的AI告警规则，无需设定阈值或基线。避免由于固定阈值产生的误报漏报重复报问题，收获更加精准的告警。

3、快速响应告警

系统预设规则，客户可根据情况自定义。设置规则告警级别，提醒告警触发的后续处理环节。部分告警提供简单的解决方案，可以快速处理异常。

在用户体验方面，系统设置在线值守的MOC工程师，时刻关注系统状态。当用户遇到问题，MOC工程师会联系用户，第一时间让客户掌握具体情况，并提供相应的解决方案，高效地解决故障隐患。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

LinkSLA CSDN认证博客专家 CSDN认证企业博客

码龄3年

455: 原创

22万+: 周排名

1万+: 总排名

49万+: 访问

: 等级

8323: 积分

2769: 粉丝

3486: 获赞

47: 评论

3859: 收藏

私信

关注

热门文章

分类专栏

智能运维 109篇
云计算 95篇

最新评论

python 日志配置方案
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
Nginx 可视化管理平台 Nginx-Proxy-Manager 中文入门指南
睫毛进眼睛了！: 啥时候改了？绑国外ip不用备案，绑国内才要备案。备案是跟ip走的
Nginx 可视化管理平台 Nginx-Proxy-Manager 中文入门指南
咕噜咕噜233: 如何使用Custom locations写不同的前端请求路径，我填完之后，访问出现一堆404
AI和监控组CP，王炸来了？
飞翔的佩奇: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！
九大微服务监控工具详解
全栈小5: 干货很多，文章内容实用性很好，技术点讲解的很到位。期待大佬的持续更新！支持！也期待大佬的指点哦【九大微服务监控工具详解，博主这篇文章，值得一看】

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。