Hadoop的机架配置rack-awareness

 

一直都说Hadoop的HDFS默认会把所有文件复制三份:

  1. 第一份随机选一个datanode
  2. 第二份在另一个机架(rack)上随机选一个datanode
  3. 第三份在第二份的机架上再选一个datanode

但是如果不特别配置的话,hadoop是不知道机架信息的,会默认所有的datanode都在同一个机架上。

如何让Hadoop知道机架信息呢?

就需要靠自己配置啦~~~

Hadoop说明

Hadoop的安装细节请参考另一篇博客:https://blog.csdn.net/lucylove3943/article/details/80589422

我这里用的例子是4台机子搭的Hadoop cluster。

master node: falcon-1

slave node: falcon-2 (10.102.2.33), falcon-3 (10.102.2.41), falcon-4 (10.102.2.49)

说明一下:falcon-2是节点的host name,后面跟的数字10.102.2.33是它的private ip。

Hadoop rack-awareneess configuration

首先进入Hadoop的configuration目录:

cd ~/hadoop-2.9.2/etc/hadoop

然后新建文档rack_topology.data:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值