一、如何添加节点?
大概配置思路:(转载于https://blog.csdn.net/czz1141979570/article/details/86712881)
1、在新节点中进行操作系统的配置,包括主机名配置,防火墙,网络,免密登陆和安装JDK等
2、在所有的节点的/etc/hosts文件中增加新节点
3、把namenode的有关配置文件复制到该节点
4、修改master节点的slaves文件,增加该节点
5、单独启动该节点上的datanode和NodeManager
./sbin/hadoop-daemon.sh start datanode
./sbin/yarn-daemon.sh start nodemanager
6、运行start-balancer.sh进行数据负载均衡操作
(负载均衡详细介绍可参考https://www.ibm.com/developerworks/cn/data/library/bd-1506-hdfsdatabalance/index.html)
./sbin/start-balancer.sh
1)如果不balance,那么cluster会把新的数据都存放在新的node上,这样会降低mapred的工作效率
2)设置平衡