从日常巡检出发,如何建设稳定性运营/报告平台
背景首先说一些日常工作场景:你的群里是否经常会发送一些巡检报告,比如qps峰值统计,cpu利用率,机器使用数量统计等等你的领导是否需要你每周发送一次公司业务层级的运行报告,包括上周有没有故障,上周所有业务的qps峰值是多少,周期内的一些业务变更或者运营活动等。所以你可能会看到类似这样的一些图:初步思考基于上述的背景,我们常规的实现方式有以下几种:日常的巡检报告,我们可能会用一个脚本定期的获取数据,然后发送到企业微信机器人、邮箱、钉钉等周、月巡检报告运营报告这些,我们可能需要手动创




