1.1. 系统的性能:是指操作系统完成任务的有效性,稳定性和响应速度。 (linux应用出现问题时,应当从应用程序,操作系统,服务器硬件和网络环境等方面综合排查,定位问题出现在哪个部分,然后集中解决。)
1.2 系统性能分析
性能调优的主要目的是使系统能够有效地利用各种资源,最大的发挥应用程序和系统之间的性能融合,使应用高效,稳定地运行。
表:判定系统资源利用状况的一般准则
1.CPU user%+sys%<70% (好)
user%+sys%=85% (坏)
user%+sys%>=90% (槽糕)
2.内存 Swap In (si)=0 Swap Out (so)=0 (好)
Per CPU with 10 page/s (坏)
More Swap In & Swap Out (槽糕)
3.磁盘 iowait% <20% (好)
iowait%=35% (坏)
iowait% >=50% (槽糕)
其中:%user:表示CPU在用户模式下的时间百分比。
%sys:表示CPU处在系统模式下的时间百分比。
%iowait:表示CPU等待输入输出完成时间的百分比。
swap in:即si,表示虚拟内存的页导入,即从SWAP DISK交换到RAM。
swap out:即so,表示虚拟内存的页导出,即从RAM交换到SWAP DISK。
1.2 系统性能分析
性能调优的主要目的是使系统能够有效地利用各种资源,最大的发挥应用程序和系统之间的性能融合,使应用高效,稳定地运行。
表:判定系统资源利用状况的一般准则
1.CPU user%+sys%<70% (好)
user%+sys%=85% (坏)
user%+sys%>=90% (槽糕)
2.内存 Swap In (si)=0 Swap Out (so)=0 (好)
Per CPU with 10 page/s (坏)
More Swap In & Swap Out (槽糕)
3.磁盘 iowait% <20% (好)
iowait%=35% (坏)
iowait% >=50% (槽糕)
其中:%user:表示CPU在用户模式下的时间百分比。
%sys:表示CPU处在系统模式下的时间百分比。
%iowait:表示CPU等待输入输出完成时间的百分比。
swap in:即si,表示虚拟内存的页导入,即从SWAP DISK交换到RAM。
swap out:即so,表示虚拟内存的页导出,即从RAM交换到SWAP DISK。
2.解决操作系统性能问题的一般思路
2.1影响linux性能的因素
cpu 内存 磁盘I/O带宽 网络I/O带宽
2.2系统性能分析工具
2.2.1 vmstat 命令 (Virtual Memory Statistics 虚拟内存统计)
可以对操作系统的内存信息,进程状态和CPU活动等进行监控。
语法: vmstat [-V] [-n] [delay [count]]
-V:表示打印出版本信息
-n:表示周期性循环的时,输出的头部信息仅仅显示一次
delay:表示两次输出之间的间隔时间
count:表示按照“delay”指定的时间间隔统计的次数。
eg: vmstat 3 表示每3秒更新一次输出信息,循环输出。
vmstat 3 5 表示每3秒更新一次输出信息,统计5次后停止输出。
2.2.2 iostat 命令 (输入/输出统计)
主要对系统的磁盘I/O操作进行监视。
语法: iostat [ -c | -d ] [-k] [-t] [-x [device]] [interval [count] ]
-c:显示cpu的情况
-d:显示磁盘的使用情况
-k:每秒以k bytes为单位显示数据
-t:打印出统计信息开始执行的时间
-x device:指定要统计的磁盘名称,默认为所有的磁盘设备
interval:表示两次输出之间的间隔时间
count:表示按照“interval”指定的时间间隔统计的次数。
2.2.3 sar 命令
可以全面地获取系统的cpu,运行队列,磁盘I/O,分页(交换区),内存,CPU中断和网络等性能数据。
格式: sar [option] [-o filename] [interval [count] ]
option常用选项:
-A: 显示系统所有资源设备(CPU,内存,磁盘)的运行状态。
-u:所有CPU在采样时间内的负载状态。
-P:当前指定CPU的使用情况。
-d:所有硬盘设备在采样时间内的使用状况。
-r:显示系统内存在采样时间内的使用状态。
-b:显示缓冲区在采样时间内的使用情况。
-v:显示进程,文件,I节点和锁表状态。
-n:显示网络运行状态。参数后面可跟DEV,EDEV,SOCK和FULL。 (DEV显示网络接口信息,EDEV显示网络错误的统计数据,SOCK显示套接字信息,FULL全显示。)
-q:显示运行队列的大小,它与系统当时平均负载相同。
-R:显示进程在采样时间内的活动情况。
-y: 显示终端设备在采样时间内的活动情况
-w: 显示系统交换活动在采样时间内的状态。
-o filename :表示将命令结果以二进制格式存放在文件中,filename是文件名。
interval:表示两次输出之间的间隔时间
count:表示按照“interval”指定的时间间隔统计的次数。
eg: sar -u 3 5 查看系统cpu的整体负载状况,每3秒统计一次,统计5次
sar -P 1 3 5 查看第二颗CPU的运行负载(系统CPU计数是从0开始的)
sar -d 3 5 查看系统磁盘的读写性能
sar -n DEV 5 3 查看网络运行状态。
2.2.4 uptime 可以检查CPU的平均负载
free 查看系统的内存使用情况
ps ,top 可以配合监控系统的进程运行状态
netstat 可以监控网络流量状态
3. 例如: linux系统下的一个网站系统,用户反映网站访问速度很慢,且有时无法访问。
第一步:检查网络,可以通过ping命令检查网站的域名解析是否正常,同时,ping服务器地址的延时是否过大等。(排除网络原因)
第二步:内存使用状况进行检查。因为网站响应速度慢,一般跟内存关联比较大,可通过free,vmstat等命令判断内存资源是否紧缺。(排内存原因)
第三步:检查CPU的负载状况。 可以通过sar,vmstat和top等命令的输出综合判断CPU是否存在过载问题。(排除CPU原因)
第四步:检查磁盘I/O是否存在瓶颈。 可以通过iostat,vmstat等命令检查磁盘的读写性能。(排除磁盘原因)
第五步: 上面四步都没有问题的话,linux系统自身的性能问题基本排除了,最后要做的是检查程序本身是否存在问题。
2.1影响linux性能的因素
cpu 内存 磁盘I/O带宽 网络I/O带宽
2.2系统性能分析工具
2.2.1 vmstat 命令 (Virtual Memory Statistics 虚拟内存统计)
可以对操作系统的内存信息,进程状态和CPU活动等进行监控。
语法: vmstat [-V] [-n] [delay [count]]
-V:表示打印出版本信息
-n:表示周期性循环的时,输出的头部信息仅仅显示一次
delay:表示两次输出之间的间隔时间
count:表示按照“delay”指定的时间间隔统计的次数。
eg: vmstat 3 表示每3秒更新一次输出信息,循环输出。
vmstat 3 5 表示每3秒更新一次输出信息,统计5次后停止输出。
2.2.2 iostat 命令 (输入/输出统计)
主要对系统的磁盘I/O操作进行监视。
语法: iostat [ -c | -d ] [-k] [-t] [-x [device]] [interval [count] ]
-c:显示cpu的情况
-d:显示磁盘的使用情况
-k:每秒以k bytes为单位显示数据
-t:打印出统计信息开始执行的时间
-x device:指定要统计的磁盘名称,默认为所有的磁盘设备
interval:表示两次输出之间的间隔时间
count:表示按照“interval”指定的时间间隔统计的次数。
2.2.3 sar 命令
可以全面地获取系统的cpu,运行队列,磁盘I/O,分页(交换区),内存,CPU中断和网络等性能数据。
格式: sar [option] [-o filename] [interval [count] ]
option常用选项:
-A: 显示系统所有资源设备(CPU,内存,磁盘)的运行状态。
-u:所有CPU在采样时间内的负载状态。
-P:当前指定CPU的使用情况。
-d:所有硬盘设备在采样时间内的使用状况。
-r:显示系统内存在采样时间内的使用状态。
-b:显示缓冲区在采样时间内的使用情况。
-v:显示进程,文件,I节点和锁表状态。
-n:显示网络运行状态。参数后面可跟DEV,EDEV,SOCK和FULL。 (DEV显示网络接口信息,EDEV显示网络错误的统计数据,SOCK显示套接字信息,FULL全显示。)
-q:显示运行队列的大小,它与系统当时平均负载相同。
-R:显示进程在采样时间内的活动情况。
-y: 显示终端设备在采样时间内的活动情况
-w: 显示系统交换活动在采样时间内的状态。
-o filename :表示将命令结果以二进制格式存放在文件中,filename是文件名。
interval:表示两次输出之间的间隔时间
count:表示按照“interval”指定的时间间隔统计的次数。
eg: sar -u 3 5 查看系统cpu的整体负载状况,每3秒统计一次,统计5次
sar -P 1 3 5 查看第二颗CPU的运行负载(系统CPU计数是从0开始的)
sar -d 3 5 查看系统磁盘的读写性能
sar -n DEV 5 3 查看网络运行状态。
2.2.4 uptime 可以检查CPU的平均负载
free 查看系统的内存使用情况
ps ,top 可以配合监控系统的进程运行状态
netstat 可以监控网络流量状态
3. 例如: linux系统下的一个网站系统,用户反映网站访问速度很慢,且有时无法访问。
第一步:检查网络,可以通过ping命令检查网站的域名解析是否正常,同时,ping服务器地址的延时是否过大等。(排除网络原因)
第二步:内存使用状况进行检查。因为网站响应速度慢,一般跟内存关联比较大,可通过free,vmstat等命令判断内存资源是否紧缺。(排内存原因)
第三步:检查CPU的负载状况。 可以通过sar,vmstat和top等命令的输出综合判断CPU是否存在过载问题。(排除CPU原因)
第四步:检查磁盘I/O是否存在瓶颈。 可以通过iostat,vmstat等命令检查磁盘的读写性能。(排除磁盘原因)
第五步: 上面四步都没有问题的话,linux系统自身的性能问题基本排除了,最后要做的是检查程序本身是否存在问题。