1.监控服务器系统参数
命令:top
查看load average、内存、交换区虚拟内存、cpu的使用情况
2.查看具体的进程、内存、交换区、io、cpu的交互
命令:vmstat 1
这个命令可以查看到运行的进程数、等待的IO进程数、交换区使用情况、交换区与内存的读写、数据块的读写、cpu资源情况等等
procs(进程)
r:运行的进程数(长期大于1结合cpu的id来判断是否需要增加cpu)
b:等待io的经常数
memory(内存)
swpd:使用虚拟内存大小,如果swpd的值不为0,但是SI,SO的值长期为0,这种情况不会影响系统性能
free:空闲物理内存大小
buff:用作缓冲的内存大小
cache:用作缓存的内存大小,如果cache的值大的时候,说明cache处的文件数多,如果频繁访问到的文件都能被cache处,那么磁盘的读IO bi会非常小。
swap(交换区-虚拟内存)
si:每秒从交换区写到内存的大小,由磁盘调入内存。
so:每秒写入交换区的内存大小,由内存调入磁盘。
注意:内存够用的时候,这2个值都是0,如果这2个值长期大于0时,系统性能会受到影响,磁盘IO和CPU资源都会被消耗。有些朋友看到空闲内存(free)很少的或接近于0时,就认为内存不够用了,不能光看这一点,还要结合si和so,如果free很少,但是si和so也很少(大多时候是0),那么不用担心,系统性能这时不会受到影响的。因为linux总是先把内存用光
IO(磁盘读写)
bi:每秒读取的块数
bo:每秒写入的块数
注意:随机磁盘读写的时候,这2个值越大(如超出1024k),能看到CPU在IO等待的值也会越大。
system(系统)
in:每秒中断数,包括时钟中断
cs:每秒上下文切换数
cpu(处理器)
us:用户进程执行时间百分比(user time) us的值比较高时,说明用户进程消耗的CPU时间多,但是如果长期超50%的使用,那么我们就该考虑优化程序算法或者进行加速
sy:内核系统进程执行时间百分比(system time) sy的值高时,说明系统内核消耗的CPU资源多,这并不是良性表现,我们应该检查原因
wa:IO等待时间百分比 wa的值高时,说明IO等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈(块操作)
id:空闲时间百分比
3.查看网络
命令:netstat -ntp
Proto:显示连接使用的协议
Recv-Q、Send-Q:指接收队列和发送队列
Local Address:本地地址ip
Foreign Address:连接方地址ip
State:协议连接状态
PID/Program name:进程id以及名称
在局域网做性能压力测试,可以使用此命令查看应用服务、客户端间请求ip都可以观察到。Recv-Q、Send-Q队列如果持续值不减少或者大于0,表示可能有问题(如带宽不够)。
4.带宽使用情况
名片:iptop
TX:发送流量
RX:接收流量
TOTAL:总流量
Cumm:运行iftop到目前时间的总流量
peak:流量峰值
rates:分别表示过去 2s 10s 40s 的平均流量
这个命令可以看到服务器带宽使用情况,带宽使用完了对性能也是有很大影响的
参考相关文章:
https://blog.csdn.net/chj_1224365967/article/details/108123486
https://www.cnblogs.com/xqzt/p/5448983.html