5.数仓项目经验—HDFS存储多目录和集群数据均衡

HDFS存储多目录和集群数据均衡

1. HDFS存储多目录

  1. 生产环境服务器磁盘情况

  2. 在这里插入图片描述

  3. hdfs-site.xml文件中配置多目录,注意新挂载磁盘的访问权限问题。

  4. HDFS的DataNode节点保存数据的路径由dfs.datanode.data.dir参数决定,其默认值file://${hadoop.tmp.dir}/dfs/data,若服务器有多个磁盘,必须对该参数进行修改。如服务器磁盘如上图所示,则该参数应修改为如下的值。

  5. <property>
        <name>dfs.datanode.data.dir</name>
      <value>file:///dfs/data1,file:///hd2/dfs/data2,file:///hd3/dfs/data3,file:///hd4/dfs/data4</value>
    </property>
    
  6. 注意:因为每台服务器节点的磁盘情况不同,所以这个配置配完之后,不需要分发

2. 集群数据均衡

2.1 节点间数据均衡
  1. #开启数据均衡命令
    start-balancer.sh -threshold 10
    
  2. 对于参数10,代表的是集群中各个节点的磁盘空间利用率相差不超过10%,可根据实际情况进行调整。

  3. #停止数据均衡命令
    stop-balancer.sh
    
  4. 注意:由于HDFS需要启动单独的Rebalance Server来执行Rebalance操作,所以尽量不要在NameNode上执行start-balancer.sh,而是找一台比较空闲的机器。

2.2 磁盘间数据均衡
  1. 生成均衡计划(我们只有一块磁盘,不会生成计划)

    hdfs diskbalancer -plan hadoop103
    
  2. 执行均衡计划

    hdfs diskbalancer -execute hadoop103.plan.json
    
  3. 查看当前均衡任务的执行情况

    hdfs diskbalancer -query hadoop103
    
  4. 取消均衡任务

    hdfs diskbalancer -cancel hadoop103.plan.json
    

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值