一、系统性能分析工具
1.常用系统命令
Vmstat、sar、iostat、netstat、free、ps、top等
(1)top
当前内核服务的任务,还显示许多主机状态的统计数据,默认情况下,它每隔5秒自动更新一次。
如:当前正常运行时间,系统负载,进程数量和内存使用率,
此外,这个命令也显示了那些使用最多CPU时间的进程(包括每个进程的各种信息,如运行用户,执行的命令等)。
(2)vmstat
Vmstat命令提供当前CPU、IO、进程和内存使用率的快照,它和top命令类似,自动更新数据,如:
$ vmstat 10
(3)iostat
Iostat提供三个报告:CPU利用率、设备利用率和网络文件系统利用率,使用-c,-d和-h参数可以分别独立显示这三个报告。
(4)free
显示主内存和交换空间内存统计数据,指定-t参数显示总内存,指定-b参数按字节为单位,使用-m则以兆为单位,默认情况下千字节为单位。
Free命令也可以使用-s参数加一个延迟时间(单位:秒)连续运行,如:
$ free -s 5
(5)sar
收集,查看和记录性能数据,这个命令比前面几个命令历史更悠久,它可以收集和显示较长周期的数据。
2.常用组合方式
vmstat、sar、iostat检测是否是CPU瓶颈
free、vmstat检测是否是内存瓶颈
iostat检测是否是磁盘I/O瓶颈
netstat检测是否是网络带宽瓶颈
二、Linux性能评估与优化
系统整体性能评估(uptime命令)
注意:
-
load average三值大小一般不能大于系统CPU的个数。
系统有8个CPU,如load average三值长期大于8,说明CPU很繁忙,负载很高,可能会影响系统性能。
-
但偶尔大于8,一般不会影响系统性能。
-
如load average输出值小于CPU个数,则表示CPU有空闲时间片,比如本例中的输出,CPU是非常空闲的
三、CPU性能评估
1.利用vmstat命令监控系统CPU
显示系统各种资源之间相关性能简要信息,主要看CPU负载情况。
r--运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU
b--在等待资源的进程数,比如正在等待I/O、或者内存交换等。
CPU
us
用户进程消耗的CPU 时间百分比。
us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法。
sy
内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。
根据经验,us+sy的参考值为80%,如果us+sy大于 80%说明可能存在CPU资源不足。
2.利用sar命令监控系统CPU
sar对系统每方面进行单独统计,但会增加系统开销,不过开销可以评估,对系统的统计结果不会有很大影响。
输出解释如下:
%user列显示了用户进程消耗的CPU 时间百分比。
%nice列显示了运行正常进程所消耗的CPU 时间百分比。
%system列显示了系统进程消耗的CPU时间百分比。
%iowait列显示了IO等待所占用的CPU时间百分比
%steal列显示了在内存相对紧张的环境下pagein强制对不同的页面进行的steal操作 。
%idle列显示了CPU处在空闲状态的时间百分比。
你是否遇到过系统CPU整体利用率不高,而应用缓慢的现象?
在一个多CPU的系统中,如果程序使用了单线程,会出现这么一个现象,CPU的整体使用率不高,但是系统应用却响应缓慢,这可能是由于程序使用单线程的原因,单线程只使用一个CPU,导致这个CPU占用率为100%,无法处理其它请求,而其它的CPU却闲置,这就导致了整体CPU使用率不高,而应用缓慢现象的发生。
四、内存性能评估
1.利用free指令监控内存
free是监控Linux内存使用状况最常用的指令
经验公式:
应用程序可用内存/系统物理内存>70%,表示系统内存资源非常充足,不影响系统性能;
应用程序可用内存/系统物理内存<20%,表示系统内存资源紧缺,需要增加系统内存;
20%<应用程序可用内存/系统物理内存<70%,表示系统内存资源基本能满足应用需求,暂时不影响系统性能
2.利用vmstat命令监控内存
memory
swpd--切换到内存交换区的内存数量(k为单位)。如swpd值偶尔非0,不影响系统性能
free--当前空闲的物理内存数量(k为单位)
buff--buffers cache的内存数量,一般对块设备的读写才需要缓冲
cache--page cached的内存数量
一般作为文件系统cached,频繁访问的文件都会被cached,如cache值较大,说明cached的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好。
swap
si--由磁盘调入内存,也就是内存进入内存交换区的数量。
so--由内存调入磁盘,也就是内存交换区进入内存的数量。
si、so的值长期不为0,表示系统内存不足。需增加系统内存。
五、磁盘I/O性能评估
1.磁盘存储基础
频繁访问的文件或数据尽可能用内存读写代替直接磁盘I/O,效率高千倍。
将经常进行读写的文件与长期不变的文件独立出来,分别放置到不同的磁盘设备上。
对于写操作频繁的数据,可以考虑使用裸设备代替文件系统。
裸设备优点:
数据可直接读写,不需经过操作系统级缓存,节省内存资源,避免内存资源争用;
避免文件系统级维护开销,如文件系统需维护超级块、I-node等;
避免了操作系统cache预读功能,减少了I/O请求
使用裸设备的缺点是:
数据管理、空间管理不灵活,需要很专业的人来操作。
2.利用iostat评估磁盘性能
解释如下:
Blk_read/s--每秒读取数据块数
Blk_wrtn/s--每秒写入数据块数
Blk_read--读取的所有块数
Blk_wrtn--写入的所有块数
可通过Blk_read/s和Blk_wrtn/s值对磁盘的读写性能有一个基本的了解.
如Blk_wrtn/s值很大,表示磁盘写操作频繁,考虑优化磁盘或程序,
如Blk_read/s值很大,表示磁盘直接读操作很多,可将读取的数据放入内存
规则遵循:
长期的、超大的数据读写,肯定是不正常的,这种情况一定会影响系统性能。
3.利用sar评估磁盘性能
通过“sar –d”组合,可以对系统的磁盘IO做一个基本的统计
参数含义:
await--平均每次设备I/O操作等待时间(毫秒)
svctm--平均每次设备I/O操作的服务时间(毫秒)
%util--一秒中有百分之几的时间用于I/O操作
对磁盘IO性能评判标准:
正常svctm应小于await值,而svctm和磁盘性能有关,CPU、内存负荷也会对svctm值造成影响,过多的请求也会间接的导致svctm值的增加。
await值取决svctm和I/O队列长度以及I/O请求模式,
如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,
如果await的值远高于svctm的值,则表示I/O队列等待太长,系统上运行的应用程序将变慢,
此时可以通过更换更快的硬盘来解决问题。
%util--衡量磁盘I/O重要指标,
如%util接近100%,表示磁盘产生的I/O请求太多,I/O系统已经满负荷工作,该磁盘可能存在瓶颈。
可优化程序或者 通过更换 更高、更快的磁盘。
六、 网络性能评估
通过ping命令检测网络的连通性
通过 netstat –i 组合检测网络接口状况
通过 netstat –r 组合检测系统的路由表信息
通过 sar –n 组合显示系统的网络运行状态