Hadoop集群新增datanode
1、新节点需要配置和其他节点一样的环境,包括jdk,hadoop程序包。修改/etc/hosts。需要配置JAVA_HOME。
2、在nomenode的conf/slaves 添加新datanode的hostname
3、在新的datanode节点中,bin目录下运行一下命令来启动datanode和tasktracker
./hadoop-daemon.sh start datanode
./hadoop-daemon.sh start tasktracker
启动后,datanod会自动和namenode通信
在一个运行很久的集群上新增新节点后,会导致文件分布不均匀,这时需要对整个集群进行平衡。
在namenode下,运行start-balancer.sh,来平衡整个集群。该命令会消耗较多的资源,所以应该在集群负载不高的时间做。