1.需求:支持用户自定义设置巡检项,巡检周期等功能
2.调研运维巡检工具的开发方案
原先在容器云平台部署了grafana-image-renderer、grafana-reporter等服务,用来将固定的dashboard图表渲染成图片,将图片导出成PDF,使用定时脚本获取grafana dashboard的图片PDF,定时发送邮件。了解到grafana-reporter是基于dashboard ID导出巡检报告,目前grafana-reporter是否支持基于panel ID导出巡检报告尚不清楚,也许可以支持用户自定义设置巡检项panel ID的功能。
3.准备巡检模板和自动化巡检脚本,通过脚本命令应能获取影响容器云稳定性因素的指标。
提交巡检报告,报告内容包括容器云的健康状态等。