生产环境服务器变慢,诊断思路和性能评估谈谈?
整机: top
命令 top (q 退出)
1、查看load average:1.57,0.89,.0.40 这个字段代表平均负载值 三个值代表平均1分钟,5分钟,15分钟。 三个相加 除以3 然后乘以100% 如果大于60% 就代表系统压力重
2、查询cpu占用率
命令 uptime
系统性能命令的精简版
CPU: vmstat
查看CPU(包含不限于)
命令 vmstat -n 2 3 (后面俩个参数 每2秒采样一次 共采样3次)
procs
r:运行和等待CPU时间片的进程数,原则商1核的CPU的运行队列不要超过2,整个系统的运行队列不能超过总核数的2倍。否则代
表系统压力过大
b: 等待资源的进程数,比如正在等待磁盘I/O、网络I/O等
cpu
us:用户进程 消耗CPU时间百分比,US值高,用户进程消耗CPU时间多,如果长期大于50%,优化程序
sy:内核进程消耗的CPU时间百分比
us+sy 参考值为80%,如果us+sy大于80%,说明可能存在CPU不足
id:处于空闲的CPU百分比 值越高越好
wa:系统等待IO的CPU时间百分比
st:来自于一个虚拟机偷取的CPU时间的百分比
查看额外
查看所有CPU核信息 mpstat -p ALL 2
每个进程使用CPU的用量分解信息 pi