监控系统基础
监控系统的功能
-
实时采集监控数据:硬件、操作系统、中间件、程序、服务等;
-
实时反馈监控状态:监控数据实时、多维度、可视化的展示监控数据,并体现监控对象的状态;
-
预知故障并告警:根据监控数据提前预知故障,并作出告警;
-
定位故障:根据故障时的监控数据,做出故障定位;
-
性能调优:提供性能方面的数据支持,比如慢sql,慢redis查询,接口响应等;
-
自动化运维:自动化扩容缩容,自动重启程序等;
监控对象
-
服务器:电源、温度、CPU、硬盘、内存、网络;
-
数据库:数据库连接数、QPS、TPS、并行处理的会话数、缓存命中率、主从延时、锁状态、慢查询;
-
中间件:Kafka、Redis、Tomcat、Nginx等;
-
应用程序:业务日志等;
监控流程
数据采集 -> 数据传输 -> 数据存储 -> 数据展示 -> 监控预警
常用监控软件
Zabbix
Open-Falcon
Prometheus