linux I/O 监控

参考

  • https://www.cnblogs.com/mauricewei/p/10502539.html
  • https://linuxtools-rst.readthedocs.io/zh_CN/latest/tool/iostat.html
  • https://www.itread01.com/content/1506341064.html

命令

  • fio 磁盘测试命令
  • iostat 磁盘实时监控命令
  • top
  • sar
  • vmstat
  • hdparm
  • dd

一 【FIO】 IO测试命令

顺序读:
fio -filename=/mnt/pmfs/1.txt -direct=1 -iodepth 1 -thread -rw=read -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest
随机写:
fio -filename=/mnt/pmfs/1.txt -direct=1 -iodepth 1 -thread -rw=randwrite -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest
顺序写:
fio -filename=/mnt/pmfs/1.txt -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=4k -size=2G -numjobs=1 -runtime=60 -group_reporting -name=mytest
混合随机读写:
fio -filename=/mnt/pmfs/1.txt -direct=1 -iodepth 1 -thread -rw=randrw -rwmixread=70 -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=mytest -ioscheduler=noop

二 【iostat】 磁盘实时监控命令

命令格式 iostat [参数] [间隔秒数] [次数]

iostat 			#无参使用
iostat -d 1		#间隔1秒
iostat -dk 1	#间隔1秒,单位kb
iostat -dm 1	#间隔1秒,单位Mb
iostat -xmd 1	#间隔1秒,单位Mb ,输出详情

# 其他参数
-C 显示CPU使用情况
-d 显示磁盘使用情况
-k 以 KB 为单位显示
-m 以 M 为单位显示
-N 显示磁盘阵列(LVM) 信息
-n 显示NFS 使用情况
-p[磁盘] 显示磁盘和分区的情况
-t 显示终端和CPU的信息
-x 显示详细信息
-V 显示版本信息

2.1 普通模式

[root@vm-1 ~]# iostat -d 1
Linux 2.6.32-279.19.3.el6.ucloud.x86_64 (vm1)   06/11/2017  _x86_64_    (8 CPU)
 
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.08    0.00    0.06    0.00    0.00   99.86
 
Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
vda               0.45         0.29         8.10    6634946  183036680
vdb               0.12         3.11        30.55   70342034  689955328

--- 
(1) avg-cpu: cpu使用情况
		%user	: 用户进程的时间百分比。
		%nice	: 用户模式下,用于nice操作,占用CPU的百分比
		%system	: 内核进程使用的 CPU 百分比
		%iowait	: CPU用于等待I/O操作占用CPU总时间的百分比
		%steal	: 管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟CPU的百分比
		%idle	: CPU空闲时间百分比
(2) Device: 各磁盘设备的IO统计信息
		Device	: 设备名称
		tps		: 每秒向磁盘设备请求数据的次数,包括读、写请求,为rtps与wtps的和。出于效率考虑,每一次IO下发后并不是立即处理请求,而是将请求合并(merge),这里tps指请求合并后的请求计数。
		Blk_read/s	: 每秒从设备(drive expressed)读取的数据量;
		Blk_wrtn/s	: 每秒向设备(drive expressed)写入的数据量;
		Blk_read	: 取样时间内,读扇区总数量
		Blk_wrtn	: 取样时间内,写扇区总数量	
		 

2.2 分析模式

[root@vm-1 ~]# iostat -xkd 1 
Linux 2.6.16.60-0.21-smp (linux)     06/13/12

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.00  9915.00    1.00   90.00     4.00 34360.00   755.25    11.79  120.57   6.33  57.60

-- 数据说明
	- 每秒向磁盘上写30M左右数据(wkB/s值) 
	- 每秒有91次IO操作(r/s+w/s),其中以写操作为主体 
	- 平均每次IO请求等待时间为120.57毫秒,处理时间为6.33毫秒 
	- 等待处理的IO请求队列中,平均有11.79个请求驻留

列名说明提示
rrqm/s每秒合并的读请求数文件系统会对读取同块(block)的请求进行合并
wrqm/s每秒合并的写请求数
r/s每秒完成的读次数合并后的读请求数
w/s每秒完成的写次数合共后的些请求数
rkB/s每秒读数据量(kB为单位)
wkB/s每秒写数据量(kB为单位)
avgrq-sz平均每次IO操作的数据量(扇区数为单位)
avgqu-sz平均等待处理的IO请求队列长度
await磁盘处理每次IO请求响应、等待时间(平均值)包括等待时间和处理时间,毫秒为单位)
svctm磁盘性能参数,每次IO请求处理时间(平均值、推断值)(毫秒为单位),推断数据,并不完全准确
%util磁盘处理IO操作的时间百分比使用率,即IO队列非空的时间比率,可能存在并行I/O

2.3 IO 瓶颈分析

命令形式 iostat -xm 1

6 个关键指标 %util 、%iowait 、%idle、svctm 、 await 、 avgqu-sz

  • %util 接近100%,说I/O系统已经满负荷。表明I/O请求太多。(磁盘瓶颈)
  • %iowait 值过高,表示硬盘可能存在I/O瓶颈。(需近一步分析是否为高速cpu原因)
  • %idle 值过高,表示CPU较空闲。小于70% 压力很大。如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。

响应时间 svctm & await 判定磁盘瓶颈

svctm 可理解为磁盘性能。
await 可理解为磁盘处理请求的响应等待时间。

  • svctm 接近 await,表示 I/O 没有等待,磁盤性能很好。
  • **await 远大于 svctm ** ,表示 I/O 队列太长,io响应太慢。应用程序变慢,更换性能更好的磁盘可解决问题。
  • avgqu-sz 比较大,也表示有大量io在等待。
  • svctm 大于 15ms ,磁盘设置响应异常。
形象的比喻:
r/s+w/s 类似于交款人的总数
平均队列长度(avgqu-sz)类似于单位时间里平均排队人的个数
平均服务时间(svctm)类似于收银员的收款速度
平均等待时间(await)类似于平均每人的等待时间
平均I/O数据(avgrq-sz)类似于平均每人所买的东西多少
I/O 操作率 (%util)类似于收款台前有人排队的时间比例
设备IO操作:总IO(io)/s = r/s(读) +w/s(写)

平均等待时间=单个I/O服务器时间*(1+2+...+请求总数-1)/请求总数

每秒发出的I/0请求很多,但是平均队列就4,表示这些请求比较均匀,大部分处理还是比较及时。

disk属性值说明:

设备说明 dm-x

设备清单中出现 dm-0,dm-1… , 一般是内核分配设备(dev253)
例如:

[root@vm-1 ~]# iostat -xkd 1 
Linux 2.6.16.60-0.21-smp (linux)     06/13/12

Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.00     1.00    0.00    8.00     0.00     0.04     9.00     0.01    0.88   0.62   0.50
dm-0              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-2              0.00     0.00    0.00    9.00     0.00     0.04     8.00     0.01    0.89   0.56   0.50

通过以下命令组合,可知设备对应关系

  • sar -d 1 # sar 命令
  • cd /dev/mapper/ # 内核分配映射
  • ll
# 先使用 sar 命令判断是否为(253) 内核映射
[root@vm-1 ~]# sar -d 1
Linux 2.6.16.60-0.21-smp (linux)     06/13/12

12:33:06 AM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
12:33:07 AM    dev8-0      4.04      0.00     40.40     10.00      0.00      0.75      0.50      0.20
12:33:07 AM  dev253-0      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
12:33:07 AM  dev253-1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
12:33:07 AM  dev253-2      5.05      0.00     40.40      8.00      0.00      0.80      0.40      0.20

# 进入  /dev/mapper/ 目录
[root@vm-1 ~]#cd /dev/mapper/

# 列出设备映射关系
[root@vm-1 ~]#ll
lrwxrwxrwx 1 root root       7 Nov 18 19:13 vg_root-lv_home -> ../dm-2
lrwxrwxrwx 1 root root       7 Nov 18 19:13 vg_root-lv_root -> ../dm-0
lrwxrwxrwx 1 root root       7 Nov 18 19:13 vg_root-lv_swap -> ../dm-1
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
主要功能: 1.读取配置文件程序 2.启动进程 3.监控进程,查看进程是否退出或者崩溃 4.若进程退出或者崩溃,重启程序。 5.支持sleep功能 6.进程若连续崩溃NUM_MAX次就进行相应的睡眠周期struct proc_struct proc: struct proc_ struct [mp: if(array) return 0 ∥切换到目录rse chdirldiri ifdp= opendir(dir}=NuLL}开日录/proc,矢败返回0,成功把描述指针返回给d return o 〃将φpro文件夹的描述符指针传递给reεddir,读取文件夹内容,循环赋值给结构体di while ((dirp= readdir(dp))= NULLY char data 301 ∥取文件名称赋值给数组daa(其中包含有进程的名称(pid sprintf(data, "s", dirp->d_name); ∥是否是由字符09组成的字符串,即得到所有进程的pid f((IsDigit(data)) prac =(struct proc_struct )4 malloc(sizeof(struct proc_struct) tmp proc: prac->pid =a: oi(dirp->d_name): It(proc tind( proc. array)) free( tmp); closedir(dp cturn proc_find 两个参数分别是两个进程描述的结构体指针 李比较两个进程pd是否相等 李*相等返回1,不相等返回0 幸率球事容球家草事家事球峰率享事球摩率球享享溶事*事卷寒球套事塞容寒/ int proc find( struct prcc_struct* src, struct proc- struct* dest) char buffer[40%6]. ps cmd[20] It fd. I sprintf(buffer, "ed/star", sre->pid); fd = open(butter, O_RDONLY) if(fd==-1) rerurn 0 memset(buffer, wO, sizeof(buffer)) len= read(fd, bufter, sizeof(bufter )-1) close(ld) if(l return 0: p= butter: p= strrchr(p, C) narq=strrchr(p, )) n=q-p-1 if (len >= sizeof, srt->name)) len= sizeof(src->name)-1 p+ l, len src->namelen]=0; =日 turn(strcmp( src->name, dest dest->name)==0)? 1: 0- 条善参数aay:让程结构体指针;参数sie进程列表数组aray的大小ie:配置文件路径 从配置文件得到指定的程序列表,将对应进程的信息填充到aray数组中 羋执行成功返回进程个数,执行失败返回0 int get_ proc( struct proc_struct array, int size, char file intnRet=o if(! array I‖(si 0)l‖fhle myprinttf"invalid parameterin retun o char line[4096]; FILE fp= fopen(file, T"); if(fp) printf("open file cs fail\n", file) return U memset(line, 0, 4095); while(fgets(lire, 4095, tp)&& nRet size) memcpy(void s)[(&arraylnRet )->cmdline), (void")line, strlen(line)-2 ) tmp= strrchr(line, / ) Lmp += I: memcpy((&array inRet))->name, tmp, strlen(tmp)- 2) nRet++ ); return(nReL); 康棒串串浓凉率旅浓串底率卖毒志着旅浓浓准溶房表 装 startProc *卷参数proc:要启动的进的结构体描述指针 启动程序 执行成功返回1,子进程退出 宗塞家康家家家家家家家家宋家家聚家苯家球察塞家塞家家容家塞家家家家室家家察家家家聚家聚寒撑家装家掌建察家家室事 int startProc (struct proc_ struct* proc, struct proc _struct*must_run_ proc int mIst_run_size static inti=d if( proc)return 0 if(strlen(proc->cmdline I<=0) return 0; int pid= forko: 〃进程内部返回值为0,返回给父进程的为自己的pid inta〓 if(pid pid= fork( ifpd≡0 execl(char")proc->cmdline,(char")prDc->name,NULL); ∥exit: It(o): sleep42片 waiL(NULL) sleep( I: if(i== must run size -1) if(check proc(&must run proc[i])==0) startProc( &mtust_run_proeli], must_run_prce, must_run_size); el if(i== must run size-11 i= else 1++ start Proc( &must_run_proclil, must_run_ proc, mustrun_ _size); !**幸幸串率幸米幸*家*幸毕零*幸幸半字幸字华米*幸半孝率非幸零幸学幸幸车 3a*8*daemon init 幸*启动配置文件当中的需要守护的程序 执行成功返回1,中途出错,返回-1 长界零家墨军零家零率家三哮零座零率零零容岸军零罕型率零零零零牢察座察零零零零季球军零容零 int moniter_ run(struct proc_struct"must_run_proc, int proc_ size) nti=0: for(i=0; i< must_run_size: i ++) ∥监控程序是否正在运行 if(check_ proc(&(must un_ proc[il))<=o) ∥厘新片动程序 startProc(&' must run procli]), must run proc, proc size return I: 幸*事率事率率**率**字幸学摩*率*幸幸学幸半*率幸字****幸中*幸学幸 春*着*信号处理函数 exit_proc 翥安全结束监控的程序 4来没有返回值 告参毒萨响幸帝称昨嗜幸古称索点响卷南都南请南幸难布际本啪昨青市南动南香请非市赤南本 void exit_ proc(int ar InL I struct proc struct proc for(i=0; i< must run_ Size: i++) proc=&(must_run_proc[i]): kill(proc->pid, SIGTERM); exit flag=I exit(o): void exit_proc(int pid 要main L.获取程序列表2启动进程3.监控进程,若程序岀或崩溃,重新启动程序4.收到退 出信号,安全结束监控程序 成功返回1,失败返回0 零牢容容家容字家容容察*禁容容字哮零常字容容容家察容牢容零容容容容容牢字家客字容牢容零容*字容客字容容字容家容容字岩 static void run moniter( void data) 读取程序列表 must_ run _size get proc(must_run_proc, sIZE, data if(rmust run Sizc <=1) return o struct sigaction act, oldact act,sa handler= exit_proc act. sa flags =SA ONESHOT sigaction(SIGTERM, &act, NULL) sigaction(SIGINT, &act, NULL) sigaction(sIGHUP, &act, NULL); 检测并启动未启动的程序 moniter_ run(must run proc, must run slze) eturn null int creat and run moniter(char * file) 开线程: pthread_t moniter_ thread if(pthread_create(&moniter_thread, NULL, run_moniter, file)==0) printf("thread create Ok, check thread start \n") return printf( thread check create Errin"): return -I 零零零零享享事职增零半非寥零享半容零摩率率零享剩率容半半享零半率零半率零率辱寒零享 要 IsDigit 参茶爹数a字符串的地址 *判断字符串是否有纯数字字符组成 春客是纯数字返回1,不是纯数字返回0 喜非要串思率串串串串家串润串串串串串串毒毒喜串串最率毒串串踪串率串串非球毒串妆串串毒串串影零串串毒事串 static int IsDigit[char aD) Int size ∥得到当前字符串的长度 size= strlen(a: ∥若字符串长度为0,则直接返回0:即宇符串为空则返回0: if(size ==0) return 0; ∥循环遍历整个字符串 forli=0; i< Size; i++) ∥如果字符小于字符0,或者大于字符9,则返回0 if(ai]<ol ai>9) retum ∥走到这一步说明字符串由字符09组成,返回1 return l; 主进程源文件:man,c main.c #include"process, h Include <stdio. h> include <stdlib h> 甲 include< unistd. I> 甲 nclude< signal> 却 nclude <sys/ ypes,h include <sys/stat. h> 甲 include< tenth> int main(void) creat_and_run_moniter("proclistini") while(l) sleep(D) turn 以上内容是程序全部源文件

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值