Datanode占用磁盘IO高问题

最新推荐文章于 2024-08-30 15:59:14 发布

风筝Lee

最新推荐文章于 2024-08-30 15:59:14 发布

阅读量3.2k

收藏 9

点赞数 3

文章标签： hadoop hdfs 磁盘io

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/breakout_alex/article/details/87970360

版权

hadoop集群版本：hadoop-2.7.2

问题现象：

iotop排查有大量的du -sk 操作占用IO比较高，且执行很长时间；

iostat -x 5：磁盘IOutil 一直处于比较高的使用率，且iowait值比较大，io有一定的等待延迟；

问题原因：

Datanode进程启动时，启动DU线程定期执行du –sk命令统计各blockpool目录的占用情况，随着心跳汇报给namenode。

执行周期默认为600000ms，配置项为fs.du.interval;

所以，对于DN来说，默认的Du，会产生大量的du -sk的操作，会造成集群严重的IO Wait增加，从而导致任务会变得缓慢。

相关代码：

解决方案（优化）：

社区优化方案：

使用 df 命令替换 du（可配置，使用df前提条件磁盘目录下存储只有hdfs单块池占用）；
增加检查间隔时间随机抖动机制；（将一个节点上同时产生的多个du操作，加个随机数，随机到集群的不同时间段，）

Fix version: 2.8.0, 3.0.0-alpha1

相关patch：

https://issues.apache.org/jira/browse/HADOOP-9884

https://issues.apache.org/jira/browse/HADOOP-12973

https://issues.apache.org/jira/browse/HADOOP-12974

https://issues.apache.org/jira/browse/HADOOP-12975

相关代码截图：

临时优化方案：

增加fs.du.interval 磁盘检测时间间隔，调整至适当大的值30min，尽量减缓这种io占用高的情况

<property>

<name>fs.du.interval</name>

<value>1800000</value>

</property>

Linux 上捕获到hdfs调用的 du -sk 命令，使用 df -k 进行替换

tip: 这个方法的前提是每个BP目录单独位于一个磁盘上。

du 脚本，对正常的du命令不进行修改

问题：应用df 替换du会有一定的数据差异；

执行机制不同： Linux df和du执行原理机制的不同，du的数据是基于文件获取的，并非针对某个分区，执行时间受限于文件和目录个数；df直接使用 statfs系统调用，直接读取分区的超级块信息获取分区使用情况，针对整个分区，直接读取超级块，运行速度不受文件目录个数影响，执行很快。
du和df不一致情况: 常见的df和du不一致情况就是文件删除的问题。当一个文件被删除后，在文件系统目录中已经不可见了，所以du就不会再统计它了。然而如果此时还有运行的进程持有这个已经被删除了的文件的句柄，那么这个文件就不会真正在磁盘中被删除，分区超级块中的信息也就不会更改。这样df仍旧会统计这个被删除了的文件。

欢迎关注本人公众号，一起讨论技术问题，公众号专注于分享大数据相关的技术原理，如spark、flink、hadoop、hbase、clickhouse等，也包括大数据相关的其他领域，例如数仓、推荐、图计算等。

风筝Lee

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

风筝Lee CSDN认证博客专家 CSDN认证企业博客

码龄9年

暂无认证

116: 原创

23万+: 周排名

17万+: 总排名

45万+: 访问

: 等级

4386: 积分

117: 粉丝

277: 获赞

42: 评论

1010: 收藏

私信

关注

热门文章

分类专栏

HDFS 2篇
数据湖 5篇
hbase 26篇
clickhouse
hadoop 20篇
其他 4篇
janusgraph 2篇
flink 4篇
面试 19篇
关系型数据库 3篇
项目管理 15篇
网络编程 6篇
编程基础 28篇
java 65篇
大数据专栏 92篇
linux内核&运维 34篇

最新评论

HBase MemStore简介
大树Frank: 写得太好了，解决了我很久的困惑
StampedLock原理分析
机械广: 背景那块我有些疑问：在读线程非常多，写线程很少的情况下，很容易导致写线程“饥饿”。 ReentrantReadWriteLock的加读锁的源码，要判断等待队列的头部是否为写锁，如果是写锁，读锁就会在等待队列中等待，防止写饥饿。那么这种形式还是无法完全解决写饥饿吗？
读写锁饥饿问题解决方案之StampedLock
AlgorithmNotes: StampedLock是基于CLH锁原理实现的, CLH是一种基于排队思想实现的自旋锁，可以保证FIFO(先进先出)的服务顺序，所以会避免写线程饥饿问题，其实就是其中实现了一个队列,每次不管是读锁也好写锁也好,未拿到锁就加入队列,然后每次解锁后队列头存储的线程节点获取锁,以此避免饥饿。 ———————————————— 非公平下也会饥饿的吧
给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url?
empty_coder: step3 里似乎没有强调如何避免重复 url 的存入。一种修改意见：求每对小文件 ai 和 bi 中相同的 url 时，可以把 ai 的 url 存储到 HashMap 中（Entry<url, cnt=0>），然后遍历 bi 的每个 url，看其是否在刚才构建的 HashMap 中且出现次数为 0。如果符合条件，就是共同且不重复的 url，更新 HashMap 对应 Entry<url, cnt++>，并将 url 存到新的文件里面
hdfs之WebHDFS和HttpFS介绍
magic_kid_2010: 使用 webhdfs 50070 端口访问，重定向到该资源所在的datanode。如果 hadoop 配置的副本数量是3。写入时是 datanode 写入完成就返回，还是要等副本都完成再返回呢？如果不等副本都完成，如果此时 datanode 挂了，但是写入返回了，是不是会导致数据丢失了？

最新文章

2024年7篇

2021年13篇

2020年147篇

2019年152篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值