本节重点介绍 : 学习目标
- 熟悉prometheus 及其生态圈内组件的使用,配置调优
- 能够发现单点问题并有高可用解决方案
- 对时序监控底层原理的理解有较深理解
- 可以进行二次开发or使用golang开发周边项目
目标
熟悉prometheus 及其生态圈内组件的使用,配置调优
- 可以熟练配置采集常见的对象,特别是k8s相关的配置
- 熟练编写promql 查询和告警表达式,熟练运用各种函数
- alertmanager路由和分组配置
- m3db 集群配置调优,并能解决常见问题如oom
- 使用如预聚合手段对重查询提速
发现单点问题并有高可用解决方案
- 采集端高可用
- 存储高可用
- 查询告警高可用
对时序监控底层原理的理解
- 倒排索引
- 时序数据压缩算法
- 数据聚合的实现
二次开发or周边项目
- exporter管控平台
- 监控和服务树整合的平台
- 监控链路配置平台
本节重点总结 : 学习目标
- 第一层次:熟悉prometheus 及其生态圈内组件的使用,配置调优
- prometheus
- grafana
- alertmanager
- m3db
- 第二层次:能够发现单点问题并有高可用解决方案
- 第三层次:对时序监控底层原理的理解有较深理解
- 采集
- 传输
- 存储
- 查询
- 告警
- 第四层次:可以进行二次开发or使用golang开发周边项目