FIO磁盘性能测试

最新推荐文章于 2025-03-29 18:16:08 发布

Mr. Sun_

最新推荐文章于 2025-03-29 18:16:08 发布

阅读量972

点赞数

分类专栏：『合集-Storage』文章标签：网络 iops FIO磁盘测试

原文链接：https://zhuanlan.zhihu.com/p/682808355

版权

『合集-Storage』专栏收录该内容

107 篇文章

订阅专栏

本文详细介绍了磁盘性能的关键指标，包括IOPS（每秒IO数量）、带宽、延迟，以及访问方式（顺序读写和随机访问）的影响。还探讨了队列深度和线程数对性能的影响，以及如何通过fio工具进行性能测试，如随机写入测试的配置和解读。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

磁盘性能指标

主要性能指标

IOPS

每秒的IO数量。体现存储系统性能的最主要指标。现在主流的IOPS都在90K以上了（机械硬盘还在5K左右徘徊），比如模拟<4K>大小的文件读写。每秒最高能读或写90000个<4K>的文件；如果增加磁盘，则每秒IO数量就可以变多。比如增加相同的一块盘则IOPS就可以翻倍。

带宽（吞吐量）

每秒钟最大吞吐数据量的大小。每秒传输多大的数据比如500M/s。iops和带宽是正相关，因为知道每秒IO数量，和平均每个IO的大小则可以算出整体每秒数据量大小也就是带宽。IOPS * I/O size = Bandwidth。

大文件持续传输型的应用需要的是充分的带宽性能，而小文件随机读写的应用则要求足够的I/O能力。在存储领域有个不成文的规定，只要以IOPS来描述，那么就一般代表是小I/O（<32KB），以Bandwidth来描述，那就是大I/O（>32KB）。

延迟

是指完成一次IO请求所需的时间。延迟是关注存储性能时最重要的单个指标。

我们从发出请求到存储层的那一刻开始测量，并在获取请求的数据或确认数据已存储在磁盘上时停止测量。数据得到响应前需要等待的时间。

他和IOPS的区别：比如说我一个主机挂了一块SSD和100块HDD，SSD速度快其实就是延迟低，就是说我发送一条请求可以比HDD更快的返回。但是这里100块HDD的IOPS要高于SSD，因为他每秒能处理的IO要更多。

条件指标

访问方式

顺序读写：比如将一个很大的文件写入。则读取大量的是相邻的顺序的数据块。这个模式可显示最高的吞吐量。主要是针对的大容量文件读写文件性能，这时我们主要关注带宽指标。

随机访问读写。不遵循文件的先后顺序，读写操作的时候能够任意跳到某个文件，主要作用是针对零碎文件(病毒扫描、启动程序等)任务。这时我们主要关注IOPS指标。

队列深度（iodepth）：

它表示平均有多少I / O请求（在运行中），也就是同时处理多少个IO。拥有队列是有益的，因为队列中的请求可以以优化的方式（通常是并行方式）提交给存储子系统。

类似于cpu处理多线程，一个cpu处理一个线程一段时间然后切换到另一个线程去处理，这样每个线程处理时间提高了，但是充分利用了CPU性能提高了多线程的性能。加大硬盘队列深度就是让硬盘不断工作，减少硬盘的空闲时间。但是代价就是提高了延迟。

不同队列深度有着不同的性能表现，通常队列深度为1时有最好的延迟表现；随着队列深度的增加，其IOPS会随之增长，QD1~QD4基本是线性提升，QD8大概是QD4的双倍，QD16又是QD8的双倍，直到获得SSD的最大IOPS（一般是32）；在未达到SSD的最大IOPS时，随着队列深度的增加，其延迟增加通常并不剧烈；在达到最大IOPS后，随着队列深度的增加，其IOPS趋于稳定，但延迟通常会随队列深度的增加而线性增长。

加大队列深度 -> 提高利用率 -> 获得IOPS和MBPS峰值 ->注意响应延迟在可接受的范围内

建议：也就是说队列深度最好设置到16或者32，以获得最大的IOPS。就是设置能达到最大IOPS的最小的队列深度。

线程数：比如设置为8。在固态硬盘内部，单次读取耗时主要分为两部分：寻址延迟时间和传输时间。单线程的时候，即使队列深度大于1，但每个访问请求的这两步都是串行的，也就是必须先寻址然后才能传输。而多线程的时候，不同线程的这两步是可以并行的。传输完线程1的数据后就可以马上开始线程2的数据传输。也就是提升线程数可以明显提升SSD的性能。但这个提升并不是倍数关系，因为可能2线程比1线程提升很大，但是8线程并不比2线程有很大幅度的性能提升。

fio指标解读

配置参数.fio

ioengine=libaio

libaio - Linux 原生的异步 I/O，这也是通常我们这边用的最多的测试盘吞吐和延迟的方法

sync - 也就是最通常的 read / write 操作

vsync - 使用 readv / writev，主要是会将相邻的 I/O 进行合并

psync - 对应的 pread / pwrite

pvsync / pvsync2 - 对应的 preadv / pwritev，以及 preadv2 / p writev2

rw=randrw

read - 顺序读

write - 顺序写

trim - 顺序裁剪

randread - 随机读

randwrite - 随机写

randtrim - 随机裁剪

rw, readwrite - 混合顺序读写

randrw - 混合的随机读写

trimwrite - 顺序的裁剪 + 顺序写

rwmixwrite=90 (混合模式使用）

混合读写中，写占的百分比

bs=4k（block size)一次io操作大小

通常我们都是读写使用相同的 block，譬如 bs=4k，我们还可以用 bs=4k,16k 来设置读是 4k，但写是 16k。每次4k的io进行测试

iodepth=16

队列深度

numjobs=8

线程数，比如设置8

size=512m

每个线程读写的数据量521M 传输完成就结束

fio输出结果分析

IOPS: 每秒的输入输出量(或读写次数)，是衡量磁盘性能的主要指标之一；

Bw: 带宽；

slat 表示fio 提交到内核某个I/O的延迟；

clat 表示fio 内核完成某个I/O的延迟；

lat 表示从fio将请求提交给内核，再到内核完成这个I/O为止所需要的时间；

关系是 lat = slat + clat

usr：表示用户空间进程；

sys：表示内核空间进程；

随机写入性能测试

不绕过缓存

表示在 /home/ehigh/test_dir 目录中创建一个大小为1G的测试文件testfile，使用随机写入的模式进行测试，每次读/写的数据量是4KB。在30s的时间内，通过启动一个工作进程或线程来进行测试。

命令执行：

fio --name=testfile --directory=/home/ehigh/test_dir --size=1G --rw=randwrite --bs=4k --ioengine=libaio --iodepth=16 --numjobs=1 --runtime=30 --time_based --end_fsync=1

说明：

--name=testfile指定生成的测试文件名称，不指定就会会直接对硬盘进行测试，可能会造成数据丢失
--directory指定测试文件存放路径，不指定就是在当前路径下
--numjobs指定测试线程的数量，模拟单线程或单任务工作负载，不测试并发造成的额外压力，设置为1就可以了
--runtime指定测试时间，短时测试一般30s差不多了，可以快速评估和比较不同配置或硬件的性能
--size指定测试文件的大小，一般1G差不多就可以了
--rw指定测试的模式，andwrite是随机写入模式。randrw: 随机读写。read: 顺序读取。write: 顺序写入。readwrite：顺序混合读写（使用rwmixread来指定读取的百分比。例如，rwmixread=70表示读取占70%，写入占30%。）。randrw：随机混合读写（也是结合rwmixread来指定读取的百分比）
--bs指定每个每个IO操作将使用4KB的大小
--end_fsync指定测试结束时，确保所有写入都同步到磁，这样更能确保测试数据的准确