前言:
服役新数据节点
目标:掌握HDFS新添加节点到集群的步骤
需求基础:
随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需
要在原有集群基础上动态添加新的数据节点。、
准备新的节点
第一步:创建一台新的虚拟机出来
第二步:IP地址
第三步:关闭防火墙,关闭selinux service iptables stop
第四步:更改主机名 vim /etc/sysconfig/network
第五步:四台机器更改主机名与IP地址映射
第六步:实现主机和新服务器的之间无密码访问 ssh-copy-id
第七步:node04安装jdk
mkdir -p /export/softwares/
mkdir -p /export/servers/
然后解压jdk安装包,配置环境变量,或将集群中的java安装目录拷贝一份,并配置环境变量。
第八步:解压Hadoop安装包
将主节点关于Hadoop的配置文件全部拷贝到新节点
cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/
scp ./* 新节点:$PWD
服役新节点具体步骤
第一步:创建dfs.hosts文件
在node01也就是namenode所在的机器的/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop目录下创建dfs.hosts
文件
第二步:node01编辑hdfs-site.xml添加以下配置
cd /export/servers/Hadoop-2.6.0-cdh5.14.0/etc/Hadoop
vim hdfs-site.xml
<property>
<name>dfs.hosts</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/dfs.hosts</value>
</property>
第三步:刷新namenode和resourceManager
hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes
第四步:namenode的slaves文件增加新服务节点主机名称
第五步:单独启动新增节点
sbin/hadoop.daemon.sh start datanode
sbin/yarn-daemon.sh start nodemanager
第六步:浏览器查看
第七步:负载均衡
sbin/start-balancer.sh
退役旧数据节点
第一步:创建dfs.hosts.exclude配置文件
第二步:编辑namenode所在机器的hdfs-site.xml
<property>
<name>dfs.hosts.exclude</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/dfs.hosts.exclude</value>
</property>
第三步:刷新namenode,刷新resourceManager
hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes
第四步:从dfs.hosts.exclude文件中删除退役节点
第五步:从namenode的slave文件中删除退役节点
第六步:负载均衡
sbin/start-balancer.sh