Promrtheus+Grafana+onealert--实现报警

最新推荐文章于 2023-12-27 18:48:27 发布

眼下一颗柠檬

最新推荐文章于 2023-12-27 18:48:27 发布

阅读量547

点赞数

分类专栏： prometheus监控文章标签： grafana 运维

本文链接：https://blog.csdn.net/S314118142/article/details/127558441

版权

prometheus监控专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

一、Grafana+onealert报警
总结

一、Grafana+onealert报警

Prometheus 报警需要使用 alertmanager 这个组件，而且报警规则需要手动编写（对运维来说不友好）。所以我这里选用 grafana+onealert 报警。注意：实现报警前把所有机器时间同步再检查一遍
登陆http://www.onealert.com/→注册帐户→登入后台管理

在这里插入图片描述

获取appkey

1.在Grafana中配置Webhook URL

1、在Grafana中创建Notification channel，选择类型为Webhook；
2、推荐选中Send on all alerts和Include image，Cloud Alert体验更佳；
3、将第一步中生成的Webhook URL填入Webhook settings Url；
URL格式：
http://api.aiops.com/alert/api/event/prometheus/bd8cc0af7b2644f1834a8d0b9d9e5ced
 
4、Http Method选择POST；
5、Send Test&Save；

在这里插入图片描述

2.测试cpu负载告警

现在可以去设置一个报警来测试了（这里以我们前面加的 cpu 负载监控来做测试）
在这里插入图片描述

#查看cpu占用率
(1- ((sum(increase(node_cpu_seconds_total{mode="idle"}[1m])) by(instance)) / (sum(increase(node_cpu_seconds_total[1m])) by(instance))))*100

在这里插入图片描述

3.测试报警

在被监控端下载一个stress测试工具

yum install -y epel*
yum install -y stress

开始测试
在这里插入图片描述
设置4核cpu，此时cpu就会被冲高

发来的报警如下图

邮箱会发来报警邮件
在这里插入图片描述
睿象云中也提示告警信息

我们解决问题后，只需在睿象云中将告警关闭就行，就会当作问题被解决了

邮件中会告知告警已解决

总结

眼下一颗柠檬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Promrtheus+Grafana+onealert--实现报警

Prometheus 报警需要使用 alertmanager 这个组件，而且报警规则需要手动编写（对运维来说不友好）。所以我这里选用 grafana+onealert 报警。注意：实现报警前把所有机器时间同步再检查一遍登陆http://www.onealert.com/→注册帐户→登入后台管理获取appkey现在可以去设置一个报警来测试了（这里以我们前面加的 cpu 负载监控来做测试）在被监控端下载一个stress测试工具开始测试设置4核cpu，此时cpu就会被冲高发来的报警如
复制链接

扫一扫