一、运维需要关注 服务器的哪些数据?
1. CPU
1.1 CPU使用率: top,vmstat
(1) 用户CPU使用率:用户态程序的使用率。top 命令 us 字段和 nice字段 (低优先级)
(2) 系统CPU使用率:内核态程序的使用率。top 命令 sy 字段
(3) 等待 I/O 的 CPU 使用率:等待 I/O 的时间百分比。top 命令 wa 字段
(4) 软中断和硬中断的 CPU 使用率: top 命令 ksoftirqd 进程对应的CPU使用率
(5) 虚拟机占用CPU 时间百分比:其他虚拟机占用的、运行客户虚拟机的 CPU 时间百分比。
1.2 CPU缓存命令率:perf
1.3 平均负载:系统的平均活跃进程数。top
2. 内存
2.1 系统已用、剩余、可用内存: free,vmstat
2.2 进程虚拟内存、常驻内存、共享内存:ps,top
2.3 swap换入换出:vmstat
2.4 进程swap换出内存:top
2.5 内存泄漏检测:memleak
2.6 指标解释:
可用内存:新进程可以使用的最大内存,包括剩余内存和可回收缓存。
swap内存:通过 Swap 换出到磁盘的内存
虚拟内存:包括了进程代码段、数据段、共享内存、已经申请的堆内存和已经换出的内存等。
常驻内存:进程实际使用的物理内存。
共享内存:与其他进程共同使用的真实的共享内存。
3. 磁盘性能指标
iostat 命令可以查得
(1) I/O使用率:磁盘处理 I/O 的时间百分比。
(2) I/O饱和度:随着IO的增加而超过所能处理的程度叫做饱和度。从读写请求完成的等待时间得出。
(3) IOPS:每秒的 I/O 请求数。
(4) 吞吐量:每秒的 I/O 请求大小(),单位为bps(比特每秒)
(5) 响应时间: I/O 请求从发出到收到响应的间隔时间。
(6) 磁盘剩余空间