hdfs配置多块磁盘

hdfs需要存写大量文件,有时磁盘会成为整个集群的性能瓶颈,所以需要优化hdfs存取速度,将数据目录配置多磁盘,既可以提高并发存取的速度,还可以解决一块磁盘空间不够的问题。

  1. 首先dfs.name.dir和yarn.nodemanager.local-dirs的目录都不大,完全可以不配多磁盘或者只配置2块磁盘,最主要就是将dfs.data.dir配置成多磁盘。所以只需要修改dfs.data.dir即可:
<property>
    <name>dfs.data.dir</name>    
    <value>/home/bigdata/datac/,/home/bigdata/datac</value>
</property>
  1. 如果配置了多磁盘,还需要配置磁盘存放选择策略,有2中磁盘存放选择策略,默认是第一种,但是第二种可能效率更高更优秀
<property>
    <name>dfs.datanode.fsdataset.volume.choosing.policy</name>
    <value>org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy</value>
 </property>

参考:
hadoop2.0的datanode多目录数据副本存放策略,hadoop2.0datanode
为datanode配置多个数据存储地

转载于:https://my.oschina.net/cjun/blog/812423

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值