Linux确认服务所在磁盘io性能状态

最新推荐文章于 2024-09-10 17:02:20 发布

独步秋风

最新推荐文章于 2024-09-10 17:02:20 发布

阅读量945

点赞数

分类专栏： Linux 服务器性能文章标签： 1024程序员节

本文链接：https://blog.csdn.net/qq_33326449/article/details/127490938

版权

Linux 同时被 2 个专栏收录

108 篇文章 3 订阅

订阅专栏

服务器性能

1 篇文章 0 订阅

订阅专栏

Linux确认服务所在磁盘io性能状态

1、背景

监控服务应用influxdb在上线前需要检查磁盘io性能，防止磁盘io性能太低影响监控数据量写入延迟。
下面以influxdb服务为例，且数据落盘在/zpaasssd目录下

2、性能查看

2.1. 确认influxdb 应用挂载节点所在磁盘分区

如默认将influxdb磁盘数据放在/zpaasssd/ 目录下

[zoms@172 supervisor]$ df -h /zpaasssd/
Filesystem                    Size  Used Avail Use% Mounted on
/dev/mapper/vgssd-lvzpaasssd  160G   36G  125G  23% /zpaasssd

可以确认目录所在磁盘分区为/dev/mapper/vgssd-lvzpaasssd

2.2 查看各分区io性能

[zoms@172 supervisor]$  sar -bdp 2 4|grep zpaasssd  # 关键词zpaasssd
Linux 4.4.65-1.el7.elrepo.x86_64 (172.16.24.70)         10/24/2022      _x86_64_        (16 CPU)
11:19:48 AM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
11:21:47 AM vgssd-lvzpaasssd      1.00      0.00      5.00      5.00      0.00      0.00      0.00      0.00
11:21:49 AM vgssd-lvzpaasssd     48.00      0.00  30483.00    635.06      0.08      1.66      0.32      1.55
11:21:51 AM vgssd-lvzpaasssd     22.50      0.00   2310.00    102.67      0.00      0.18      0.13      0.30
11:21:53 AM vgssd-lvzpaasssd     52.50      0.00  37290.00    710.29      0.08      1.61      0.22      1.15
Average:    vgssd-lvzpaasssd     31.00      0.00  17522.00    565.23      0.04      1.35      0.24      0.75

3. 磁盘I/O和CPU及内存的关系

[zoms@172 supervisor]$ iostat -c
Linux 4.4.65-1.el7.elrepo.x86_64 (172.16.24.70)         10/24/2022      _x86_64_        (16 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
          14.11    0.00    1.97    0.11    0.00   83.80

一般会重点关注 %iowait 和 %idle，分别表示 CPU 等待 IO 完成时间的百分比和 CPU 空闲时间百分比。

如果 %iowait 较高，则表明磁盘存在 IO 瓶颈；如果 %idle 较高，则 CPU 比较空闲；

如果两个值都比较高，则有可能 CPU 在等待分配内存，瓶颈在内存，此时应该加大内存；

如果 %idle 较低，则此时瓶颈在 CPU，应该增加 CPU 资源。

4、性能判定

对于磁盘 IO 性能，一般有如下评判标准：

await，通俗理解就想我们去医院看病排队等待的时间，这个值和医生的服务速度（svctm）和你前面排队的人数（avgqu-sz）有关。一般地系统IO响应时间应该低于5ms，如果大于10ms就比较大了。  await 值的大小一般取决与 svctm 的值和 I/O 队列长度以 及I/O 请求模式，如果svctm的值与await很接近，表示几乎没有I/O等待，磁盘性能很好，如果await的值远高于svctm的值，则表示I/O队列等待太长，系统上运行的应用程序将变慢，此时可以通过更换更快的硬盘或者升级CPU来解决问题。

%util：%util 项的值也是衡量磁盘 I/O 的一个重要指标，衡量IO的繁忙程度，这个值越大，说明产生的IO请求较多，IO压力较大，我们可以结合%idle参数来看，如果 %idle < 70% 就说明 IO 比较繁忙了。

如果 %util 接近 100% ，表示磁盘产生的 I/O 请求太多，I/O 系统已经满负荷的在工作，该磁盘可能存在瓶颈。长期下去，势必影响系统的性能，可以通过优化程序或者通过更换更高、更快的磁盘来解决此问题。（当然如果是多磁盘，即使%util是100%，因为磁盘的并发能力，所以磁盘使用未必就到了瓶颈）