第二次进阶:告警恢复和告警抑制
https://www.jianshu.com/p/9b68ba28da0d
第一次实践!!! Prometheus-alertmanager
https://blog.csdn.net/aixiaoyang168/article/details/98474494
第一次k8s告警:https://blog.csdn.net/yanggd1987/article/details/109357238
k8s集群外安装Prometheus:https://blog.csdn.net/yanggd1987/article/details/108807171
grafana-k8s插件:https://www.cnblogs.com/wangxu01/articles/11648858.html
关于告警的一些思考
告警给的json数据,除了包含警报本身的ip traceid url 等准确的警报信息 之外,必须包含以下标签
1 group分组标签 , 可以分不同的项目组 , alertmanager路由至不同的项目组群。
2 warning or error 标签, 可以分不同的级别 , alertmanager路由至 不同的报警媒介,例如普通故障给邮件,中级故障给webhook,高级故障发短信。
# 推荐阅读
https://www.jianshu.com/p/b9dcdaa117c7
k8s安装alertmanger:
https://www.jianshu.com/p/23a1cc116b1c
原文:
https://www.cnblogs.com/gschain/p/11697200.html
github:
https://github.com/prometheus/alertmanager/releases
https://github.com/prometheus/alertmanager/
官方教程: