iostat
iostat主要用于监控系统设备的IO负载情况,iostat首次运行时显示自系统启动开始的各项统计信息,之后运行iostat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
[root@localhost app]
# yum list|grep iostat
pcp-
import
-iostat2pcp.x86_64 3.11.8-7.el7 base
[root@localhost app]
# yum -y install pcp-import-iostat2pcp
[root@localhost app]
# iostat
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 10
/24/2017
_x86_64_ (1 CPU)
avg-cpu: %user %
nice
%system %iowait %steal %idle
0.44 0.00 0.30 0.04 0.00 99.22
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
sda 0.43 9.55 14.19 737417 1095615
scd0 0.00 0.00 0.00 44 0
[root@localhost app]
#
|
各个输出项目的含义如下:
avg-cpu段:总体cpu使用情况统计信息,对于多核cpu,这里为所有cpu的平均值
%user: 在用户级别运行所使用的CPU的百分比.
%nice: nice操作所使用的CPU的百分比.
%sys: 在系统级别(kernel)运行所使用CPU的百分比.
%iowait: CPU等待硬件I/O时,所占用CPU百分比.它指示cpu用于等待io请求完成的时间,主要看iowait的值。
%idle: CPU空闲时间的百分比.
Device段:各磁盘设备的IO统计信息
tps:每秒进程下发的IO读、写请求数量,该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。"一次传输"意思是"一次I/O请求"。多个逻辑请求可能会被合并为"一次I/O请求"。"一次传输"请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的block数据量(一扇区为512bytes),单位为K;
kB_wrtn/s:每秒向设备(drive expressed)写入的block数据量,单位为K;
kB_read:读取的block总数据量,单位为K;
kB_wrtn:写入的block总数量数据量,单位为K。
语法
iostat [options] [interval [count]]
参数
-d [facility]表示,显示设备(磁盘)使用状态,默认监控所有的硬盘设备,可以指定某一设备,如-d sda。;
-k某些使用block为单位的列强制使用Kilobytes为单位,默认单位块
-m 某些使用block为单位的列强制使用MB为单位,默认单位块
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
|
[root@localhost app]
# iostat -d -k 1 3 #没1秒一次 刷新3次磁盘的使用状态
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 10
/25/2017
_x86_64(1 CPU)
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
fd0 0.00 0.00 0.00 4 0
sda 0.26 4.66 7.25 746585 1161425
scd0 0.00 0.00 0.00 44 0
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
fd0 0.00 0.00 0.00 0 0
sda 0.00 0.00 0.00 0 0
scd0 0.00 0.00 0.00 0 0
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
fd0 0.00 0.00 0.00 0 0
sda 0.00 0.00 0.00 0 0
scd0 0.00 0.00 0.00 0 0
[root@localhost app]
# iostat -d -k 1
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 10
/25/2017
_x86_64(1 CPU)
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
fd0 0.00 0.00 0.00 4 0
sda 0.26 4.66 7.25 746585 1161490
scd0 0.00 0.00 0.00 44 0
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
fd0 0.00 0.00 0.00 0 0
sda 0.00 0.00 0.00 0 0
scd0 0.00 0.00 0.00 0 0
^C
[root@localhost app]
# iostat -d sda 1 4
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 10
/25/2017
_x86_64(1 CPU)
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
sda 0.26 4.66 7.25 746585 1161502
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
sda 1.01 0.00 1.01 0 1
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
sda 0.00 0.00 0.00 0 0
Device: tps kB_read
/s
kB_wrtn
/s
kB_read kB_wrtn
sda 0.00 0.00 0.00 0 0
[root@localhost app]
#
|
-x 显示和io相关的扩展数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
[root@localhost app]
# iostat -d sda -x -k 1 1
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 10
/25/2017
_x86_64_ (1 CPU)
Device: rrqm
/s
wrqm
/s
r
/s
w
/s
rkB
/s
wkB
/s
avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.02 0.11 0.12 0.14 0 4.62 7.19 90.47 0.01 26.45 11.86 38.50 2.43 0.06
[root@localhost ~]
# iostat -x
Linux 3.10.0-327.el7.x86_64 (localhost.localdomain) 01
/09/2018
_x86_64_ (8 CPU)
avg-cpu: %user %
nice
%system %iowait %steal %idle
0.06 0.00 0.02 0.00 0.00 99.92
Device: rrqm
/s
wrqm
/s
r
/s
w
/s
rkB
/s
wkB
/s
avgrq-sz avgqu-sz await r_await w_await svctm %util
sda 0.00 0.00 0.00 0.19 0.20 1.72 19.47 0.00 0.42 2.51 0.36 0.37 0.01
[root@localhost ~]
#
|
rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);
wrqm/s:每秒这个设备相关的写入请求有多少被Merge了。
rsec/s:每秒读取的扇区数;
wsec/:每秒写入的扇区数。
rKB/s:The number of read requests that were issued to the device per second,单位为K;
wKB/s:The number of write requests that were issued to the device per second,单位为K;
r/s 和 w/s 分别是每秒的读操作和写操作,而rKB/s 和wKB/s 列以每秒千字节为单位显示了读和写的数据量 如果这两对数据值都很高的话说明磁盘io操作是很频繁。
avgrq-sz 平均请求扇区的大小,单位是扇区
avgqu-sz 是平均请求队列的长度。毫无疑问,队列长度越短越好。
await: 每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。
svctm 表示平均每次设备I/O操作的服务时间(以毫秒为单位)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长, 系统上运行的应用程序将变慢。
%util: 在统计时间内所有处理IO时间,除以总共统计时间,util = (r/s+w/s) * (svctm/1000),util=(0.12+0.14)*(2.43/1000)=0.0006318,所以该参数暗示了设备的繁忙程度
。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。 idle小于70% IO压力就较大了,一般读取速度有较多的wait.
-p device | ALL
与-x选项互斥,用于显示块设备及系统分区的统计信息.也可以在-p后指定一个设备名,如:
# iostat -p hda
或显示所有设备
# iostat -p ALL
-c 获取cpu部分状态值
-t 在输出数据时,打印搜集数据的时间.
-V 打印版本号和帮助信息.
top 命令
Tasks:
total 进程总数
running 正在运行的进程数
sleeping 睡眠的进程数
stopped 停止的进程数
zombie 僵尸进程数
Cpu(s):
us 用户空间占用CPU百分比
sy 内核空间占用CPU百分比
ni 用户进程空间内改变过优先级的进程占用CPU百分比
id 空闲CPU百分比
wa 等待输入输出的CPU时间百分比
wa 的百分比可以大致的体现出当前的磁盘io请求是否频繁。如果 wa的数量比较大,说明等待输入输出的的io比较多。
vmstat
vmstat 命令报告关于线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息。由 vmstat 命令生成的报告可以用于平衡系统负载活动。系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和。
Procs
r: 等待运行的进程数 b: 处在非中断睡眠状态的进程数 w: 被交换出去的可运行的进程数。此数由 linux 计算得出,但 linux 并不耗尽交换空间
如果发现等待的进程和处在非中断睡眠状态的进程数非常多,并且发送到块设备的块数和从块设备接收到的块数非常大,那就说明磁盘io比较多。
Memory
swpd: 虚拟内存使用情况,单位:KB
free: 空闲的内存,单位KB
buff: 被用来做为缓存的内存数,单位:KB
Swap
si: 从磁盘交换到内存的交换页数量,单位:KB/秒
so: 从内存交换到磁盘的交换页数量,单位:KB/秒
IO
bi: 发送到块设备的块数,单位:块/秒
bo: 从块设备接收到的块数,单位:块/秒
System
in: 每秒的中断数,包括时钟中断
cs: 每秒的环境(上下文)切换次数
CPU
按 CPU 的总使用百分比来显示
us: CPU 使用时间
sy: CPU 系统使用时间
id: 闲置时间