运行中hadoop增加datanode

最新推荐文章于 2023-10-16 23:38:15 发布

wf1982

最新推荐文章于 2023-10-16 23:38:15 发布

阅读量7.7k

点赞数

文章标签： hadoop 集群服务器 each

本文链接：https://blog.csdn.net/wf1982/article/details/6322789

版权

本文详细介绍了如何向已运行的Hadoop集群中增加新节点的过程，包括配置环境、设置hosts、启动服务等步骤，并提供了block均衡的方法。同时，还讲解了如何使用Decommission特性从集群中移除节点，确保数据平衡转移。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

向一个正在运行的Hadoop集群中增加几个新的Nodes

1. 新节点上部署java/hadoop程序，配置相应的环境变量

2. 新节点上增加用户，从master上拷贝id_rsa.pub并配置authorized_keys

3. 新节点上设置host，只要有本机和master的host即可

4. 新节点上建立相关的目录，并修改属主

5. master的slaves文件中增加上相的节点，master上增加相应的host

6. 在新节点上启动datanode和tasktracker

/opt/sohuhadoop/hadoop/bin/hadoop-daemon.sh start datanode
/opt/sohuhadoop/hadoop/bin/hadoop-daemon.sh start tasktracker

7. 进行block块的均衡

在hdfs-site.xml中增加设置balance的带宽，默认只有1M：

<property>
    <name>dfs.balance.bandwidthPerSec</name>
    <value>10485760</value>
    <description>
        Specifies the maximum bandwidth that each datanode can utilize for the balancing purpose in term of the number of bytes per second.
    </description>
</property>

运行以下命令：

/opt/sohuhadoop/hadoop/bin/start-balancer.sh -threshold 3

均衡10个节点，移动400G数据，大概花费了3个小时

The cluster is balanced. Exiting…
Balancing took 2.9950980555555557 hours