查询进程的IO

最新推荐文章于 2022-09-25 21:45:01 发布

weixin_33829657

最新推荐文章于 2022-09-25 21:45:01 发布

阅读量196

点赞数

文章标签：操作系统 awk git

原文链接：http://blog.51cto.com/wwdhks/1031900

版权

一.前言

linux下有大量的系统命令vmstat、iostat等可以反映系统的总体io情况，但是不能监测具体进程的io情况，本文将介绍两种方法：
1.如果内核版本大于2.6.20，通过 /proc/pid/io 便可以获取进程的io信息。
2.通过echo 1 > /proc/sys/vm/block_dump ，来把 block 读写（WRITE/READ/DIRTY）状况 dump 到日志里，通过 dmesg 命令来查看。

二. /proc/pid/io
(详细解释：http://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=blob;f=Documentation/filesystems/proc.txt;hb=HEAD)
示例：
test:/tmp# dd if=/dev/zero of=/tmp/test.dat &
[1] 3828
test:/tmp # cat /proc/3828/io
rchar: 323934931 // 读出的总字节数，read或者pread()中的长度参数总和（pagecache中统计而来，不代表实际磁盘的读入）
wchar: 323929600 // 写入的总字节数，write或者pwrite中的长度参数总和
syscr: 632687 // read()或者pread()总的调用次数
syscw: 632675 // write()或者pwrite()总的调用次数
read_bytes: 0 // 实际从磁盘中读取的字节总数 (这里if=/dev/zero 所以没有实际的读入字节数)
write_bytes: 323932160 // 实际写入到磁盘中的字节总数
cancelled_write_bytes: 0 // 由于截断pagecache导致应该发生而没有发生的写入字节数（可能为负数）

检测工具dstat (http://dag.wieers.com/home-made/dstat/dstat-0.7.2.tar.bz2 ) 的top_io 模块就是利用此功能实现。dstat的详细说明可以到这里http://dag.wieers.com/home-made/dstat/

三.block_dump具体操作步骤是(我们现在就用这个方法)：
#sysctl vm.block_dump=1
or
# echo 1 > /proc/sys/vm/block_dump

然后就可以通过 dmesg 就可以观察到各个进程 IO 活动的状况了：
#dmesg -c

ttserver(4433): READ block 719116688 on sda5

ttserver(4433): READ block 723081936 on sda5

ttserver(4433): READ block 725404976 on sda5

ttserver(4432): READ block 718188120 on sda5

ttserver(4430): READ block 716487624 on sda5

ttserver(4432): READ block 718060912 on sda5

ttserver(4433): READ block 716325320 on sda5

redis-server(5956): WRITE block 107005128 on sda5

redis-server(5956): WRITE block 107005136 on sda5

redis-server(5956): WRITE block 107005144 on sda5

redis-server(5956): WRITE block 107005152 on sda5

redis-server(5956): WRITE block 107005312 on sda5

redis-server(5956): WRITE block 107005320 on sda5

redis-server(5956): WRITE block 107005328 on sda5

因此可以确定redis导致写io，ttserver导致读io过高。

通过一些脚本分析这些数据就可以得到各个进程的IO情况。下文便描述了这种方法（不同版本的linux下这里dmesg日志格式可能不同）

How to find per-process I/O statistics on Linux
Newer Linux kernels have per-process I/O accounting and you can use the iotop tool to find out what’s performing I/O, but in many cases I’m trying to find the source of an I/O problem in an older kernel. I found sort of a hack-ish way to do that today, while trying to figure out why a system was basically unresponsive.
I founda post on Stack Overflowthat showed a way you can get per process I/O statistics from the kernel even in older kernels. I adapted this to my needs, and wrote a little script.
Here’s how you use it. First, get it:
wget http://aspersa.googlecode.com/svn/trunk/iodump
Then turn on kernel messages about I/O:
echo 1 > /proc/sys/vm/block_dump
This makes the kernel start writing messages about every I/O operation that takes place. Now all you have to do is get those messages and feed them into my script:

然后在shell执行：
while true; do sleep 1; dmesg -c; done | perl iodump

过几十秒之后按ctrl+c中断查看结果。

root@kanga:~# while true; do sleep 1; dmesg -c; done | perl iodump

# Caught SIGINT.

TASK PID TOTAL READ WRITE DIRTY DEVICES

kjournald 2878 84610 0 84610 0 sda5

redis-server 17792 7128 0 7128 0 sda5

ttserver 4431 961 961 0 0 sda5

kjournald 968 941 0 941 0 sda2

ttserver 4432 880 880 0 0 sda5

ttserver 4433 855 855 0 0 sda5

ttserver 4430 843 843 0 0 sda5

pdflush 26804 71 0 71 0 sda2, sda5, sdb1

kjournald 2880 44 0 44 0 sdb1

nginx 7222 43 43 0 0 sda5

注意这里的pid跟我们用ps -ef|grep ttserver 看到的pid不一样。

ll /proc/4431/exe

lrwxrwxrwx 1 root root 0 Oct 19 20:37 /proc/4431/exe -> /usr/local/bin/ttserver

看到的是启动ttserver的pid，苦逼啊，不确定到底是哪个ttserver进程（端口）。

这里还有个网上找的脚本分析dmesg 的输出的：

#!/bin/bash

#/etc/init.d/rsyslog stop
/etc/init.d/syslog stop
echo 1 > /proc/sys/vm/block_dump
dmesg -c >/dev/null
sleep 60
#dmesg | awk '/(READ|WRITE|dirtied)/ {process[$2]++} END {for (x in process) {print process[x], x;} }' |sort -nr |awk '{print $2" "$1}' | head -n 10
dmesg | awk '/WRITE/ {process[$2]++} END {for (x in process) {print process[x], x;} }' |sort -nr |awk '{print $2" "$1}' | head -n 10

echo 0 > /proc/sys/vm/block_dump
/etc/init.d/syslog start
#/etc/init.d/rsyslog start

转载于:https://blog.51cto.com/wwdhks/1031900