1. 简介
项目中需要使用夜莺(版本:V6)提供的告警自愈功能,那应该如何使用这个功能呢?
2. 参考资料
我首先想到的是去官网上查找相关资料,结果没让人失望,找到了不少相关资料,请先自行通过文档链接进行查阅。
2.1. 使用手册
官方使用手册:告警自愈 ,这个里面包含了一个视频教程,可自行观看学习。
2.2. 如何使用告警自愈模块?
在FAQ里我找到了一篇很有用的文档:如何使用告警自愈模块?
此文档介绍了如何安装 ibex-server :使用 ibex 模块做告警自愈脚本的下发执行。
2.3. 告警自愈不生效
当我参考上面的文档操作之后发现告警自愈功能仍然不生效,我找到了一个解决此问题的文档:告警自愈不生效。
3. 如何使用告警自愈?
3.1. 架构图
3.2. 安装启动ibex-server
自行参考 使用 ibex 模块做告警自愈脚本的下发执行 来操作。
3.3. 夜莺自愈配置
ibex-server
安装启动完成之后,在夜莺中进行配置(按需替换Address
中的IP地址),菜单位置:告警自愈-自愈配置:
Address = "http://127.0.0.1:10090"
BasicAuthUser = "ibex"
BasicAuthPass = "ibex"
Timeout = 3000
3.4. Categraf配置
Categraf侧的告警自愈配置位于主配置文件中,参考:Categraf 主配置说明 (默认未启用告警自愈功能),配置示例(按需替换servers
中的IP地址)如下:
# 是否启用告警自愈agent
[ibex]
enable = true
## ibex flush interval
interval = "1000ms"
## n9e ibex server rpc address
servers = ["127.0.0.1:20090"]
## temp script dir
meta_dir = "./meta"
3.5. 启动Categraf
参考 Categraf 下载、安装和使用 自行操作。
3.6. 创建自愈脚本
自行创建告警自愈脚本,菜单位置【告警自愈-自愈脚本】。
3.7. 配置告警回调地址
菜单位置:【告警管理-告警规则】。编辑告警规则并保存:
其中回调地址中的数字"1"表示自愈脚本ID,可在【告警自愈-自愈脚本】菜单页查看。
3.8. 等待告警触发
触发告警条件产生告警,比如创建一条很快就能触发的告警规则(mem_used_percent > 0
)。
3.9. 查看自愈脚本执行情况
告警触发后,能在菜单【告警规则-活跃告警】中查询到对应的告警,可以通过菜单【告警自愈-执行历史】查看自愈脚本执行情况。
3.10. 告警自愈不生效
如果告警已触发,且对应的告警规则配置了告警自愈脚本的回调地址,结果却没有执行自愈脚本,参考 告警自愈不生效 文档自行排查问题。