系统问题排查
监控
系统问题排查主要通过监控指标来定位的问题出在哪里,监控主要分为主机监控和应用程序监控。
主机监控
主机主要用来运行应用程序或则应用程序容器,所以系统的运行和主机的健康程度有关系。主机我们一般关注CPU使用、内存使用、磁盘IO和网络等。
主机监控一般涉及以下指标:
- CPU使用率
- 内存使用率
- 磁盘IO使用率
- 网络IO使用率
- TCP连接数
应用程序监控
应用程序有自身的一些健康标准或则接口信息,还有应用程序本身运行的虚拟机或则容器。下面以Java程序JVM监控为例。
JVM监控一般涉及的参数:
- 对象个数
- 线程个数
- 垃圾回收次数
- JVM内存分配
JMX 参数监控
注:JMX监控
JMX主要对Java应用程序和JVM相关信息进行监控。
日志
日志是问题查找和数据存储备份的一个关键点,通过日志我们可以定位系统执行过程出现的问题。