本机或本地服务器运行缓慢时:
机器运行缓慢通常是由于消耗太多系统特定的资源,资源有CPU,RAM,磁盘I/O以及网络。
解决这个问题,考虑的问题:
1:平均负载(uptime)可能是最先用到的基本度量标准,并且平均负载不会因为CPU的数量而改变。
2:使用top命令解决负载问题。查看id(CPU空闲时间),如果id值高而系统运行慢,则排除高CPU负载,再看id。
查看wa(I/O等待)。如果wa值低而系统运行慢,则排除磁盘或者网络I/O的问题,先看wa。
3:由于用户CPU时间比过高引起的高负载(时间高且id小),在top中的%CPU查看,可以kill掉大量使用内存时间的进程。
4:内存不足的问题:在top中Mem:和Swap:,辨别是否耗尽RAM的方法是查看文件缓存cache,如果实际用的内存减去cache的值(实际上使用RAM)很大,同时交换存储的值也很高,很有可能的确内存问题。在top中的%MEM查看,同样kill掉。当系统内存快要耗尽,OOM(out of memory)终结者会开始终止进程,在/var/log/syslog中可以看到。
5:高I/O等待时间问题:先看RAM,如果还有大量可用的RAM,则考虑那个进程占用大量I/O,用iostat查看,也可以用iotop。
问题发生后的高负载处理:
1:配置sysstat,isstat就是在sysstat的包中,并且包含能报告CPU和RAM,配置文件为:/etc/sysconfig/sysstat
2:查看CPU统计信息,使用sysstat中的sar工具
3:查看RAM统计信息,使用sar -r查看
4:查看磁盘I/O统计信息,使用sar -b查看
5:查看某一时间段的统计信息,使用sar -s 开始时间 -e 结束时间,这个是CPU的时间段。