linux修改io调度算法,Linux IO调度算法

Linux IO调度算法

Linux IO调度算法操作系统的调度CPU调度    CPU schedulerIO调度       IO schedulerIO调度器的总体目标是希望让磁头能够总是往一个方向移动,移动到底了再往反方向走,这恰恰就是现实生活中的电梯模型,所以IO调 度器也被叫做电梯. (elevator)而相应的算法也就被叫做电梯算法.而Linux中IO调度的电梯算法有好几种,as(Anticipatory),cfq(Complete Fairness Queueing),deadline,noop(No Operation).具体使用哪种算法我们可以在启动的时候通过内核参数elevator来指定.一)I/O调度的4种算法1)CFQ(完全公平排队I/O调度程序)特点:在最新的内核版本和发行版中,都选择CFQ做为默认的I/O调度器,对于通用的服务器也是最好的选择.CFQ试图均匀地分布对I/O带宽的访问,避免进程被饿死并实现较低的延迟,是deadline和as调度器的折中.CFQ对于多媒体应用(video,audio)和桌面系统是最好的选择.CFQ赋予I/O请求一个优先级,而I/O优先级请求独立于进程优先级,高优先级的进程的读写不能自动地继承高的I/O优先级.工作原理:CFQ为每个进程/线程,单独创建一个队列来管理该进程所产生的请求,也就是说每个进程一个队列,各队列之间的调度使用时间片来调度,以此来保证每个进程都能被很好的分配到I/O带宽.I/O调度器每次执行一个进程的4次请求.2)NOOP(电梯式调度程序)特点:在Linux2.4或更早的版本的调度程序,那时只有这一种I/O调度算法.NOOP实现了一个简单的FIFO队列,它像电梯的工作主法一样对I/O请求进行组织,当有一个新的请求到来时,它将请求合并到最近的请求之后,以此来保证请求同一介质.NOOP倾向饿死读而利于写.NOOP对于闪存设备,RAM,嵌入式系统是最好的选择.电梯算法饿死读请求的解释:因为写请求比读请求更容易.写请求通过文件系统cache,不需要等一次写完成,就可以开始下一次写操作,写请求通过合并,堆积到I/O队列中.读请求需要等到它前面所有的读操作完成,才能进行下一次读操作.在读操作之间有几毫秒时间,而写请求在这之间就到来,饿死了后面的读请求.3)Deadline(截止时间调度程序)特点:通过时间以及硬盘区域进行分类,这个分类和合并要求类似于noop的调度程序.Deadline确保了在一个截止时间内服务请求,这个截止时间是可调整的,而默认读期限短于写期限.这样就防止了写操作因为不能被读取而饿死的现象.Deadline对数据库环境(Oracle RAC,MySQL等)是最好的选择.4)AS(预料I/O调度程序)特点:本质上与Deadline一样,但在最后一次读操作后,要等待6ms,才能继续进行对其它I/O请求进行调度.可以从应用程序中预订一个新的读请求,改进读操作的执行,但以一些写操作为代价.它会在每个6ms中插入新的I/O操作,而会将一些小写入流合并成一个大写入流,用写入延时换取最大的写入吞吐量.AS适合于写入较多的环境,比如文件服务器AS对数据库环境表现很差.查看当前系统支持的IO调度算法dmesg | grep -i scheduler[~]# dmesg | grep -i schedulerio scheduler noop registeredio scheduler anticipatory registeredio scheduler deadline registeredio scheduler cfq registered (default)查看当前系统的I/O调度方法:cat /sys/block/sda/queue/schedulernoop anticipatory deadline [cfq]临地更改I/O调度方法:例如:想更改到noop电梯调度算法:echo noop > /sys/block/sda/queue/scheduler想永久的更改I/O调度方法:修改内核引导参数,加入elevator=调度程序名vi /boot/grub/menu.lst更改到如下内容:kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet重启之后,查看调度方法:cat /sys/block/sda/queue/schedulernoop anticipatory [deadline] cfq已经是deadline了二 )I/O调度程序的测试本次测试分为只读,只写,读写同时进行.分别对单个文件600MB,每次读写2M,共读写300次.1)测试磁盘读:[tmp]# echo deadline > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 6.81189 seconds, 92.4 MB/sreal 0m6.833suser 0m0.001ssys 0m4.556s[tmp]# echo noop > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 6.61902 seconds, 95.1 MB/sreal 0m6.645suser 0m0.002ssys 0m4.540s[tmp]# echo anticipatory > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 8.00389 seconds, 78.6 MB/sreal 0m8.021suser 0m0.002ssys 0m4.586s[tmp]# echo cfq > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 29.8 seconds, 21.1 MB/sreal 0m29.826suser 0m0.002ssys 0m28.606s结果:第一 noop:用了6.61902秒,速度为95.1MB/s第二 deadline:用了6.81189秒,速度为92.4MB/s第三 anticipatory:用了8.00389秒,速度为78.6MB/s第四 cfq:用了29.8秒,速度为21.1MB/s2)测试写磁盘:[tmp]# echo cfq > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 6.93058 seconds, 90.8 MB/sreal 0m7.002suser 0m0.001ssys 0m3.525s[tmp]# echo anticipatory > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 6.79441 seconds, 92.6 MB/sreal 0m6.964suser 0m0.003ssys 0m3.489s[tmp]# echo noop > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 9.49418 seconds, 66.3 MB/sreal 0m9.855suser 0m0.002ssys 0m4.075s[tmp]# echo deadline > /sys/block/sda/queue/scheduler[tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 6.84128 seconds, 92.0 MB/sreal 0m6.937suser 0m0.002ssys 0m3.447s测试结果:第一 anticipatory,用了6.79441秒,速度为92.6MB/s第二 deadline,用了6.84128秒,速度为92.0MB/s第三 cfq,用了6.93058秒,速度为90.8MB/s第四 noop,用了9.49418秒,速度为66.3MB/s3)测试同时读/写[tmp]# echo deadline > /sys/block/sda/queue/scheduler[tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 15.1331 seconds, 41.6 MB/s[tmp]# echo cfq > /sys/block/sda/queue/scheduler[tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 36.9544 seconds, 17.0 MB/s[tmp]# echo anticipatory > /sys/block/sda/queue/scheduler[tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 23.3617 seconds, 26.9 MB/s[tmp]# echo noop > /sys/block/sda/queue/scheduler[tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300300+0 records in300+0 records out629145600 bytes (629 MB) copied, 17.508 seconds, 35.9 MB/s测试结果:第一 deadline,用了15.1331秒,速度为41.6MB/s第二 noop,用了17.508秒,速度为35.9MB/s第三 anticipatory,用了23.3617秒,速度为26.9MS/s第四 cfq,用了36.9544秒,速度为17.0MB/s三)ioniceionice可以更改任务的类型和优先级,不过只有cfq调度程序可以用ionice.有三个例子说明ionice的功能:采用cfq的实时调度,优先级为7ionice -c1 -n7 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&采用缺省的磁盘I/O调度,优先级为3ionice -c2 -n3 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&采用空闲的磁盘调度,优先级为0ionice -c3 -n0 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&ionice的三种调度方法,实时调度最高,其次是缺省的I/O调度,最后是空闲的磁盘调度.ionice的磁盘调度优先级有8种,最高是0,最低是7.注意,磁盘调度的优先级与进程nice的优先级没有关系.一个是针对进程I/O的优先级,一个是针对进程CPU的优先级.Anticipatory I/O scheduler                适用于大多数环境,但不太合适数据库应用Deadline I/O scheduler                     通常与Anticipatory相当,但更简洁小巧,更适合于数据库应用CFQ I/O scheduler                            为所有进程分配等量的带宽,适合于桌面多任务及多媒体应用,默认IO调度器Default I/O scheduler

来源: http://www.bubuko.com/infodetail-1976943.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值