系统调优,就是找出操作系统的瓶颈,并且优化操作系统去减少这些瓶颈。单单靠调整内核的一些参数并不能从根本上解决问题。Linux系统的性能是和几个子系统相关的。这些子系统包括以下四个方面:
1、CPU;
2、内存使用情况;
3、I/O情况;
4、网络状态;
这些子系统的性能互相依赖,其中任意一个高利用率都会很容易引起其他子系统的问题,例如以下几种情形:
大量的页面IO写入请求会塞满内存的读写队列;
高达Gbit的数据通过千兆以太网会耗尽CPU;
CPU在试图保持空闲内存队列的时,会被耗尽;
大量的来自于内存的磁盘写请求会耗尽CPU和IO通道。
为了调优Linux系统,出现系统瓶颈的位置必须找到。有时候发现可能是一个子系统引起这个问题,但是也有可能导致其他子系统过载。
在寻找瓶颈之前必须理解系统的行为分析,一般任何系统的应用程序栈都分为两种:
IO范围:
此类应用程序一般大量使用内存和潜在的存储系统。这是由于此类程序一般在处理大量的数据,这类程序一般不需要大量的CPU或者网络(除了存储设备是给予网路的,比如分布式文件系统),此类程序使用CPU资源发起IO请求,然后CPU进入休眠状态。我们实际见到的数据库程序通常被认为是此类程序。
CPU范围:
此类程序需要大量使用CPU资源。此类程序需要CPU做大量的批处理和数学运算。高吞吐量的Web服务器、邮件服务器,任何一种和服务器相关的程序都被认为是属于CPU类的应用程序。
系统的利用率由系统管理员的期望与系统的特点决定。了解系统的性能好坏就要去了解期望系统是怎样的。这就需要为参数建立基线用以衡量。统计数据必须给予系统可接受的性能,所以可以和其不可接受的性能相比较。为了说明这一点,举个下面的例子(使用vmstat,一秒钟打印一次系统负载情况)说明:
第一台机器满足基线条件,可以看到最后一个参数id,代表cpu的空闲时间,cpu空闲时间保持在72%~100%。
# vmstat 1
procs memory swap io system cpu
r b swpd free buff cache si so bi bo in cs us sy wa id
1 0 138592 17932 126272 214244 0 0 1 18 109 19 2 1 1 96
0 0 138592 17932 126272 214244 0 0 0 0 105 46 0 1 0 99
0 0 138592 17932 126272 214244 0 0 0 0 198 62 40 14 0 45
0 0 138592 17932 126272 214244 0 0 0 0 117 49 0 0 0 100
0 0 138592 17924 126272 214244 0 0 0 176 220 938 3 4 13 80
0 0 138592 17924 126272 214244 0 0 0 0 358 1522 8 17 0 75
1 0 138592 17924 126272 214244 0 0 0 0 368 1447 4 24 0 72
0 0 138592 17924 126272 214244 0 0 0 0 352 1277 9 12 0 79
第二台为高负载情况,可以看到cpu空闲时间为0,一直处于忙的状态。
# vmstat 1
procs memory swap io system cpu
r b swpd free buff cache si so bi bo in cs us sy wa id
2 0 145940 17752 118600 215592 0 1 1 18 109 19 2 1 1 96
2 0 145940 15856 118604 215652 0 0 0 468 789 108 86 14 0 0
3 0 146208 13884 118600 214640 0 360 0 360 498 71 91 9 0 0
2 0 146388 13764 118600 213788 0 340 0 340 672 41 87 13 0 0
2 0 147092 13788 118600 212452 0 740 0 1324 620 61 92 8 0 0
2 0 147360 13848 118600 211580 0 720 0 720 690 41 96 4 0 0
2 0 147912 13744 118192 210592 0 720 0 720 605 44 95 5 0 0
2 0 148452 13900 118192 209260 0 372 0 372 639 45 81 19 0 0
2 0 149132 13692 117824 208412 0 372 0 372 457 47 90 10 0 0
对Linux进行监控的时候一般需要安装一下几个工具:
vmstat :通用性能工具
mpstat :提供每个CPU统计数据
sar :通用性能监视工具
iostat :提供磁盘统计数据
netstat :提供网络统计数据
dstat :监控统计数据聚合器(加-lamp可以监控到所有的参数)
iptraf :网络状态监视表
netperf :网络带宽工具
ethtool :报告以太网接口配置
iperf :网络带宽工具
tcptrace :网络数据包分析工具