节点内DataNode磁盘使用率不均衡处理指导

最新推荐文章于 2024-03-04 11:21:39 发布

hongtaq156136

最新推荐文章于 2024-03-04 11:21:39 发布

阅读量1.3k

点赞数 1

分类专栏： hadoop hdfs

本文链接：https://blog.csdn.net/hongtaq156136/article/details/86686561

版权

hadoop 同时被 2 个专栏收录

18 篇文章 1 订阅

订阅专栏

hdfs

10 篇文章 0 订阅

订阅专栏

问题背景与现象

单个节点内DataNode的各磁盘使用率不均匀。

例如：

复制

<span style="color:#333333">189-39-235-71:~ # df -h
Filesystem  Size  Used Avail Use% Mounted on
/dev/xvda  360G  92G   250G  28% /
/dev/xvdb  700G  900G   200G  78% /srv/BigData/hadoop/data1
/dev/xvdc  700G  900G   200G  78% /srv/BigData/hadoop/data2
/dev/xvdd  700G  900G   200G  78% /srv/BigData/hadoop/data3
/dev/xvde  700G  900G   200G  78% /srv/BigData/hadoop/data4
/dev/xvdf  10G   900G   890G  2% /srv/BigData/hadoop/data5
189-39-235-71:~ #  </span>

可能原因

部分磁盘故障，更换为新盘，因此新盘使用率低。

增加了磁盘个数，如原先4个数据盘，现扩容为5个盘。

原因分析

DataNode节点内写block磁盘时，有2种策略“轮询”和“优先写剩余磁盘空间多的磁盘”，默认是“轮询”。

参数说明：dfs.datanode.fsdataset.volume.choosing.policy

可选值：

轮询：org.apache.hadoop.hdfs.server.datanode.fsdataset.RoundRobinVolumeChoosingPolicy
优先写剩余空间多的磁盘： org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy

解决办法

将DataNode选择磁盘策略的参数 dfs.datanode.fsdataset.volume.choosing.policy 的值改为

org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy
让DataNode根据磁盘剩余空间大小，优先选择磁盘剩余空间多的节点存储数据副本。 说明：
- 针对新写入到本DataNode的数据会优先写磁盘剩余空间多的磁盘；
- 部分磁盘使用率较高，依赖业务逐渐删除在HDFS中的数据（老化数据）来逐渐降低。

hongtaq156136

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
节点内DataNode磁盘使用率不均衡处理指导

问题背景与现象单个节点内DataNode的各磁盘使用率不均匀。例如：复制&lt;span style="color:#333333"&gt;189-39-235-71:~ # df -hFilesystem Size Used Avail Use% Mounted on/dev/xvda 360G 92G 250G 28% //dev/xvdb 700G ...
复制链接

扫一扫