Promrtheus+Grafana+onealert--实现报警


一、Grafana+onealert报警

Prometheus 报警需要使用 alertmanager 这个组件,而且报警规则需要手动编写(对运维来说不友好)。所以我这里选用 grafana+onealert 报警。注意:实现报警前把所有机器时间同步再检查一遍
登陆http://www.onealert.com/→注册帐户→登入后台管理

在这里插入图片描述
在这里插入图片描述
获取appkey
在这里插入图片描述

1.在Grafana中配置Webhook URL

1、在Grafana中创建Notification channel,选择类型为Webhook;
2、推荐选中Send on all alerts和Include image,Cloud Alert体验更佳;
3、将第一步中生成的Webhook URL填入Webhook settings Url;
URL格式:
http://api.aiops.com/alert/api/event/prometheus/bd8cc0af7b2644f1834a8d0b9d9e5ced
 
4、Http Method选择POST;
5、Send Test&Save;

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.测试cpu负载告警

现在可以去设置一个报警来测试了(这里以我们前面加的 cpu 负载监控来做测试)
在这里插入图片描述

#查看cpu占用率
(1- ((sum(increase(node_cpu_seconds_total{mode="idle"}[1m])) by(instance)) / (sum(increase(node_cpu_seconds_total[1m])) by(instance))))*100

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.测试报警

在被监控端下载一个stress测试工具

yum install -y epel*
yum install -y stress

开始测试
在这里插入图片描述
设置4核cpu,此时cpu就会被冲高

发来的报警如下图

邮箱会发来报警邮件
在这里插入图片描述
睿象云中也提示告警信息
在这里插入图片描述
我们解决问题后,只需在睿象云中将告警关闭就行,就会当作问题被解决了
在这里插入图片描述
邮件中会告知告警已解决
在这里插入图片描述


总结

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值