监控系统发展史
1.SNMP监控时代
2.当今的监控时代
zabbix、prometheus
3.未来的监控系统
DataOps、AI0ps、立体
监控系统组件
- 指标数据采集(抓取)
- 指标数据存储
- 指标数据趋势分析及可视化
- 告警
监控体系
系统层监控
- 系统监控:CPU、Load、Memory、Swap、Disk IO、Processes、Kernel Parameters等。
- 网络监控:网络设备、工作负载、网络延迟、丢包率等。
中间件及基础设施类系统监控
- 消息中间件:Kafka、RocketMQ、RabbitMQ等。
- Web服务容器:Tomcat和Jetty等;
- 数据库及缓存系统:MySQ、PostgreSQL、MogoDB、ElasticSearch、Redis等。
- 数据库连接池:ShardingSpere等。
- 存储系统:Ceph等。
应用层监控
- 用于衡量应用程序代码的状态和性能。
业务层监控
- 用于衡量应用程序的价值,例如电子商务网站上的销售量。
- QPS、DAU日活、转化率。
- 业务接口:登录数、注册数、订单量、搜索量和支付量等。
云原生时代的可观测性
可观测性系统
- 指标监控(Metncs):随时间推移产生的一些与监控相关的可聚合数据点。
- 日志监控(Logging):离散式的日志或事件。
- 链路跟踪(Tracing):分布式应用调用链跟踪。
CNCF将可观测性和数据分析归类一个单独的类另,且划分成了4个子类
- 监控系统:以Prometheus等为代表。
- 日志系统:以ElasticStack和PLGStack等为代表。
- 分布式调用链跟踪系统:以Zipkin、Jaeger、SkyWalking、Pinpoint等为代表。
- 混沌工程系统:以ChaosMonkey和ChaosBlade等为代表。
著名的监控方法
Goole的四个黄金指标
- 常用于在服务级别帮助衡量终端用户体验、服务中断、业务影响等层面的问题。
- 适用于应用及服务监控。
Netfllx的USE方法
- 全称为“UtilizatlonSaturat10nandErrorsMethod。
- 主要用于分析系统性能问题,可以指导用户快速识别资源瓶颈以及错误的方法。
- 应用于主机指标监控。
WeaveCloud的RED方法
- VeaveC10ud基于Google的四个黄金指标的原则下结合Prome山eus以及容器实践。
- 细化和总结的方法论,特别适合于云原生应用以及微服务架构应用的监控和度量。
文章来源:监控系统的前生今世及选型