top等性能分析

最新推荐文章于 2024-09-02 12:43:18 发布

lixiangchibang

最新推荐文章于 2024-09-02 12:43:18 发布

阅读量1.4k

点赞数 1

分类专栏：性能分析文章标签： top性能分析

本文链接：https://blog.csdn.net/lixiangchibang/article/details/91045998

版权

性能分析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一 linux服务器性能查看

1.1 cpu性能查看

1、查看物理cpu个数：

cat /proc/cpuinfo |grep "physical id"|sort|uniq|wc -l

2、查看每个物理cpu中的core个数：

//cat /proc/cpuinfo |grep "cpu cores"|wc –l

cat /proc/cpuinfo |grep "cores"|uniq

3、逻辑cpu的个数：

cat /proc/cpuinfo |grep "processor"|wc -l

物理cpu个数*核数=逻辑cpu个数（不支持超线程技术的情况下）

1.2 内存查看

1、查看内存使用情况：

#free -m

total used free shared buffers cached

Mem: 3949 2519 1430 0 189 1619

-/+ buffers/cache: 710 3239

Swap: 3576 0 3576

total：内存总数

used：已经使用的内存数

free：空闲内存数

shared：多个进程共享的内存总额

- buffers/cache：(已用)的内存数，即used-buffers-cached

+ buffers/cache：(可用)的内存数，即free+buffers+cached

Buffer Cache用于针对磁盘块的读写；

Page Cache用于针对文件inode的读写，这些Cache能有效地缩短I/O系统调用的时间。

对操作系统来说free/used是系统可用/占用的内存；

对应用程序来说-/+ buffers/cache是可用/占用内存,因为buffers/cache很快就会被使用。

我们工作时候应该从应用角度来看。

free打印出的内存信息主要分为两种，一种是安装的内存，一种是用磁盘虚拟的内存，就是这里的Swap，相信装过Linux系统的同学肯定不陌生交换分区，这里Swap大小就是我们分区的时候分配的大小。
下面来分别解释以下每个列的意思：

total:去掉为硬件和操作系统保留的内存后剩余的内存总量。许多人奇怪自己的电脑安装了一共8G的内存，但是显示总共只有七点几G的，现在应该没什么疑惑了把，不管Linux还是Windows都会有部分内存是保留给硬件和操作系统的！

userd：当前已使用的内存总量。

free：空闲的或可以使用的内存总量

shared：共享内存大小，主要用于进程间通信

buff(buffers):主要用于块设备数据缓冲，例如记录文件系统的metadata（目录、权限等等信息）。

cache:主要用于文件内容缓冲

available:可以使用的内存总量

buffers与cached的区别:

对于应用程序来说，buffers/cached 是等于可用的，因为buffer/cached是为了提高文件读取的性能，当应用程序需在用到内存的时候，buffer/cached会很快地被回收。

所以从应用程序的角度来说可用内存=系统free memory+buffers+cached.

buffers是指用来给块设备做的缓冲大小，他只记录文件系统的metadata以及 tracking in-flight pages,cached是用来给文件做缓冲。

那就是说：buffers是用来存储，目录里面有什么内容，权限等等,而cached直接用来记忆我们打开的文件的。

关于为什么需要缓冲，这里简单解释以下：我们知道，在CPU，内存，外存的运行速度之间，存在这样的关系：

CPU比内存快100倍，内存比磁盘快十万倍，且他们之间的差距还在增大！

因此为了协调他们速度之间的不匹配，缓存就由此而生，在CPU内部的缓存，为了协调CPU和内存之间速度的不匹配，而内存的产生也是为了协调磁盘和CPU速度的不匹配。有个这样的一个形象的描述：把CPU的一个时钟周期看作一秒。那么，从L1 cache(CPU的一级缓存)读取信息就好像是拿起桌上的一张草稿纸（3秒）；从L2 cache(CPU的二级缓存)读取信息则是从身边的书架上取出一本书（14秒）；而从主存中读取信息则相当于走到办公楼下去买个零食（4分钟），而等待硬盘寻道的时间相当于离开办公大楼并开始长达一年零三个月的环球旅行，而这仅仅是寻道时间！

free的详细使用方法

语　　法： free [-hbkmotV][-s <间隔秒数>]

补充说明：free指令会显示内存的使用情况，包括实体内存，虚拟的交换文件内存，共享内存区段，以及系统核心使用的缓冲区等。

参　　数：

-b 　以Byte为单位显示内存使用情况。

-k 　以KB为单位显示内存使用情况。

-m 　以MB为单位显示内存使用情况。

-h 以比较人性化的方式显示内存使用情况。

-o 　不显示缓冲区调节列。

-s <间隔秒数> 　持续观察内存使用状况。

-t 　显示内存总和列。

-V 　显示版本信息。

free的实现方式

关于free的实现，其实是调用linux下的/proc/meminfo文件

可以对比一下：

zhoupan@Lenovo-G485:~$ free

total used free shared buff/cache available

Mem: 3636688 2286620 240768 79560 1109300 1210716

Swap: 1998844 0 1998844

zhoupan@Lenovo-G485:~$ cat /proc/meminfo

MemTotal: 3636688 kB

MemFree: 239996 kB

MemAvailable: 1209972 kB

Buffers: 96424 kB

Cached: 912480 kB

SwapCached: 0 kB

Active: 2535176 kB

Inactive: 646160 kB

Active(anon): 2174012 kB

Inactive(anon): 77972 kB

Active(file): 361164 kB

Inactive(file): 568188 kB

Unevictable: 448 kB

Mlocked: 448 kB

SwapTotal: 1998844 kB

SwapFree: 1998844 kB

Dirty: 60 kB

Writeback: 0 kB

AnonPages: 2172872 kB

Mapped: 397968 kB

Shmem: 79560 kB

Slab: 100424 kB

SReclaimable: 68764 kB

SUnreclaim: 31660 kB

KernelStack: 8896 kB

PageTables: 42788 kB

NFS_Unstable: 0 kB

Bounce: 0 kB

WritebackTmp: 0 kB

CommitLimit: 3817188 kB

Committed_AS: 6151536 kB

VmallocTotal: 34359738367 kB

VmallocUsed: 0 kB

VmallocChunk: 0 kB

HardwareCorrupted: 0 kB

AnonHugePages: 1112064 kB

CmaTotal: 0 kB

CmaFree: 0 kB

HugePages_Total: 0

HugePages_Free: 0

HugePages_Rsvd: 0

HugePages_Surp: 0

Hugepagesize: 2048 kB

DirectMap4k: 175872 kB

DirectMap2M: 3602432 kB

DirectMap1G: 0 kB

>>由于系统在高速的运转，可能存在部分数据不相同

1.3 硬盘查看

1、查看硬盘及分区信息：

fdisk -l

2、查看文件系统的磁盘空间占用情况：

df -h

3、查看硬盘的I/O性能（每隔一秒显示一次，显示5次）：

iostat -x 1 5

iostat是含在套装systat中的,可以用yum -y install systat来安装。

常关注的参数：

如%util接近100%,说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘可能存在瓶颈。

如idle小于70%，I/O的压力就比较大了，说明读取进程中有较多的wait。

4、查看linux系统中某目录的大小：

du -sh /root

如发现某个分区空间接近用完，可以进入该分区的挂载点，用以下命令找出占用空间最多的文件或目录，然后按照从大到小的顺序，找出系统中占用最多空间的前10个文件或目录：

du -cksh *|sort -rn|head -n 10

1.4 查看平均负载

有时候系统响应很慢，但又找不到原因，这时就要查看平均负载了，看它是否有大量的进程在排队等待。

最简单的命令：

uptime--查看过去的1分钟、5分钟和15分钟内进程队列中的平均进程数量。

还有动态命令top
我们只关心以下部分：

top - 21:33:09 up 1:00, 1 user, load average: 0.00, 0.01, 0.05

如果每个逻辑cpu当前的活动进程不大于3，则系统性能良好；

如果每个逻辑cpu当前的活动进程不大于4，表示可以接受；

如果每个逻辑cpu当前的活动进程大于5，则系统性能问题严重。

一般计算方法：负载值/逻辑cpu个数

还可以结合vmstat命令来判断系统是否繁忙，其中：

procs

r：等待运行的进程数。

b：处在非中断睡眠状态的进程数。

w：被交换出去的可运行的进程数。

memeory

swpd：虚拟内存使用情况，单位为KB。

free：空闲的内存，单位为KB。

buff：被用来作为缓存的内存数，单位为KB。

swap

si：从磁盘交换到内存的交换页数量，单位为KB。

so：从内存交换到磁盘的交换页数量，单位为KB。

bi：发送到块设备的块数，单位为KB。

bo：从块设备接受的块数，单位为KB。

system

in：每秒的中断数，包括时钟中断。

cs：每秒的环境切换次数。

cpu

按cpu的总使用百分比来显示。

us：cpu使用时间。

sy：cpu系统使用时间。

id：闲置时间。

1.5 其他参数

查看内核版本号：

uname -a

简化命令：uname -r

查看系统是32位还是64位的：

file /sbin/init

查看发行版：

cat /etc/issue

或lsb_release -a

查看系统已载入的相关模块：

lsmod

查看pci设置：

lspci

二 Linux服务器性能评估

2.1.1 影响Linux服务器性能的因素

1. 操作系统级

CPU

内存

磁盘I/O带宽

网络I/O带宽

2. 程序应用级

2.1.2 系统性能评估标准

影响性能因素	好	坏	糟糕
CPU	user% + sys%< 70%	user% + sys%= 85%	user% + sys% >=90%
内存	Swap In（si）＝0 Swap Out（so）＝0	Per CPU with 10 page/s	More Swap In & Swap Out
磁盘	iowait % < 20%	iowait % =35%	iowait % >= 50%

其中：

%user：表示CPU处在用户模式下的时间百分比。

%sys：表示CPU处在系统模式下的时间百分比。

%iowait：表示CPU等待输入输出完成时间的百分比。

swap in：即si，表示虚拟内存的页导入，即从SWAP DISK交换到RAM

swap out：即so，表示虚拟内存的页导出，即从RAM交换到SWAP DISK

2.1.3 系统性能分析工具

1.常用系统命令

Vmstat、sar、iostat、netstat、free、ps、top等

2.常用组合方式

vmstat、sar、iostat检测是否是CPU瓶颈

free、vmstat检测是否是内存瓶颈

iostat检测是否是磁盘I/O瓶颈

netstat检测是否是网络带宽瓶颈

2.1.4 Linux性能评估与优化

系统整体性能评估（uptime命令）
uptime

16:38:00 up 118 days, 3:01, 5 users,load average: 1.22, 1.02, 0.91

注意：

load average三值大小一般不能大于系统CPU的个数。

系统有8个CPU,如load average三值长期大于8，说明CPU很繁忙，负载很高，可能会影响系统性能。

但偶尔大于8，一般不会影响系统性能。
如load average输出值小于CPU个数，则表示CPU有空闲时间片，比如本例中的输出，CPU是非常空闲的

2.2.1 CPU性能评估

1.利用vmstat命令监控系统CPU

显示系统各种资源之间相关性能简要信息，主要看CPU负载情况。

下面是vmstat命令在某个系统的输出结果：

[root@node1 ~]#vmstat 2 3

procs

———–memory———- —swap– —–io—- –system– —–cpu——

r b swpd freebuff cache si so bi bo incs us sy idwa st

0 0 0 162240 8304 67032 0 0 13 21 1007 23 0 1 98 0 0

0 0 0 162240 8304 67032 0 0 1 0 1010 20 0 1 100 0 0

0 0 0 162240 8304 67032 0 0 1 1 1009 18 0 1 99 0 0

Procs

r--运行和等待cpu时间片的进程数，这个值如果长期大于系统CPU的个数，说明CPU不足，需要增加CPU

b--在等待资源的进程数，比如正在等待I/O、或者内存交换等。

CPU

用户进程消耗的CPU 时间百分比。
us的值比较高时，说明用户进程消耗的cpu时间多，但是如果长期大于50%，就需要考虑优化程序或算法。

内核进程消耗的CPU时间百分比。Sy的值较高时，说明内核消耗的CPU资源很多。

根据经验，us+sy的参考值为80%，如果us+sy大于 80%说明可能存在CPU资源不足。

2.利用sar命令监控系统CPU

sar对系统每方面进行单独统计，但会增加系统开销，不过开销可以评估，对系统的统计结果不会有很大影响。

下面是sar命令对某个系统的CPU统计输出：

[root@webserver ~]# sar -u 3 5

Linux

2.6.9-42.ELsmp (webserver) 11/28/2008_i686_

(8 CPU)