之前写了一篇原生Apache Hadoop集群搭建,现在补充一下动态扩增节点的问题
创建新的虚拟机,用户名保持一致
linux:
1、时间同步
2、主机名配置
3、关闭防火墙
4、配置hosts文件(给每个节点的/etc/hosts文件增加新节点的IP和主机名)
5、免秘钥登录 ssh
6、安装jdk,配置环境变量
使用下面的命令将java复制到HadoopSlave上:
[baofu@master hadoop]$ cd
[baofu@master ~]$ scp -r java baofu@slave:~/
再发送.bash_profile配置文件
source ~/.bash_profile生效(注意用普通用户)
java -version查看版本
- hadoop
将已经配置完成的Hadoop复制到从节点HadoopSlave上
[baofu@master hadoop]$ cd
[baofu@master ~]$ scp -r hadoop-2.7.1 baofu@slave:~/
再次生效source ~/.bash_profile
发送
slaves(两个从节点)
单步启动:
启动datanode:sbin/hadoop-daemon.sh start datanode
启动nodemanager:sbin/yarn-daemon.sh start nodemanager
新添加节点不用格式化,开始检查(jps、web UI、PI实例),如果以上的3个验证步骤都没有问题,说明集群正常启动。