1.应用场景
主要用于监控告警. |
2.学习/操作
背景 目前所在公司项目采用的告警平台服务[付费] 开发语言采用nodeJS开发.
有时候, 目前的方案可能并不是最优的, 这是一个取舍问题,也是演变过程.
1.介绍 Pager duty : 寻呼机 责任 社区:https://community.pagerduty.com/forum/ Pagerduty是一套付费监控报警系统,经常作为SRE/运维人员的监控报警工具,可以和市面上常见的监控工具直接整合,例如和zabbix整合,我遇到的最多的场景还是和zabbix整合,当有服务器出现异常的时候,zabbix会通过pagerduty对当前设置的值班的人员进行短信+电话通知.
2.使用/开发 //此处使用nodeJS 开发 2.1 支持的API Client Libraries github: https://github.com/kmart2234/node-pagerduty
2.2 登录 //登录页面截图
2.3 生成用于token
Note: 记住Token //下次不可查看
2.4 开始使用 这里做一个监控服务, 通过定时查询kibana 指定错误log, 如每隔5分钟查询log, 如果出现指定错误log, 就触发pageduty服务, 从而发送到slack 指定channel. 工具: AWS Lambda + wormly + pugeduty + slack.
简述步骤: 1.代码编写以及上传部署到AWS Lambda 步骤省略. 2.然后配置wormly进行定时请求lambda的api.具体步骤暂时省略. //这里暂时Disabled ,因为服务尚未上线. 其中又涉及到第3步中生成的 来自于 PageDuty 的集成wormly webhooks中的Integration Key. 正在这个key将wormly与pageduty联系在一起.
3.结合PageDuty进行告警 A.打开PageDuty B.新建Service,[点击 New Service] C.输入Name, 选择wormly webhooks继承方式,其他暂时只需要默认设置就可,点击左下角 Add Service D.切换到Integrations tab. 配置slack后面来发送alert. PageDuty初步配置完毕.
4.等待告警确认.TBD
Note: pageduty还可以直接通过接口code去操作, 暂时没有涉及到.
后续补充 ... |
3.问题/补充
1.国内相同产品: OneAlert 百度告警平台 http://gaojing.baidu.com/
2.关于webhook --- TBD https://segmentfault.com/a/1190000020249988?utm_source=tag-newest https://support.pagerduty.com/docs/webhooks //pageduty - Webhooks |
4.参考
https://developer.pagerduty.com/docs/get-started/getting-started/ //文档 https://developer.pagerduty.com/docs/tools-libraries/client-libraries/ //API Client Libraries https://www.zhihu.com/question/32084832 //Pagerduty有详细的中文介绍吗? 国内有类似Pagerduty的通告服务吗? https://www.503error.com/2018/pagerduty-%E6%9F%A5%E8%AF%A2%E5%B9%B6ack-alert/1515.html //pagerduty 查询并ack alert |
后续补充
...