Hadoop增加新节点环境配置（自用）_hadoop集群添加新的节点需要改什么内容

2401_84164672

已于 2024-04-15 05:22:26 修改

阅读量750

点赞数 20

分类专栏： 2024年程序员学习文章标签： hadoop java 大数据

于 2024-04-15 05:22:25 首次发布

本文链接：https://blog.csdn.net/2401_84164672/article/details/137762305

版权

2024年程序员学习专栏收录该内容

104 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文


重启


* 查看防⽕墙状态 systemctl status firewalld


![](https://img-blog.csdnimg.cn/direct/401fa90ddf8146f496e8a473e7a8858a.png)


2. 在/opt ⽬录下创建 module（程序⽂件夹）、software（安装包） ⽂件夹


 [root@hadoop100 ~]# mkdir /opt/module


 [root@hadoop100 ~]# mkdir /opt/software


![](https://img-blog.csdnimg.cn/direct/718304c400e64cf098a9ad7874631be4.png)


### **2****.****在Hadoop106节点安装JDK、Hadoop**


#### **·安装JDK**


1. 将jdk-8u341-linux-x64.tar.gz 利⽤xftp上传到/opt/software


2. 解压jdk到/opt/module⽂件夹


[root@hadoop100 ~]# tar -zxvf /opt/software/jdk-8u341-linux-x64.tar.gz -C /opt/module/


3. nano /etc/profile.d/my\_path.sh ⽂件，输⼊

#JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_341

export PATH= $P A T H :$ JAVA_HOME/bin


4. source ⼀下 /etc/profile ⽂件，让新的环境变量 PATH ⽣效


[root@hadoop100 ~]# source /etc/profile


5. 检验⼀下成功不


[root@hadoop100 ~]# java -version


#### **·安装Hadoop**


1. 将hadoop-3.3.3.tar.gz利⽤xftp上传到/opt/software


2. 解压hadoop到/opt/module⽂件夹


[root@hadoop100 ~]# tar -zxvf /opt/software/hadoop-3.3.3.tar.gz -C /opt/module/


3. 在 /etc/profile.d/my\_path.sh ⽂件，加⼊下⾯内容

#HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-3.3.3

export PATH= $P A T H :$ HADOOP_HOME/bin

export PATH= $P A T H :$ HADOOP_HOME/sbin


![](https://img-blog.csdnimg.cn/direct/f348ed7cfea84deb8ae1edd646525582.png)


4. source ⼀下 /etc/profile ⽂件，让新的环境变量 PATH ⽣效


[root@hadoop100 ~]# source /etc/profile


![](https://img-blog.csdnimg.cn/direct/a012aaa506f4455c895c4bc23e745aeb.png)


5. 测试


[root@hadoop100 ~]# hadoop version



#### **·新增ens37网卡**


1. 关闭 hadoop106


2. 右击虚拟机选项卡 -> 配置 -> 添加 -> ⽹络适配器 -> 改成桥接


3. 启动 hadoop106


4. nmcli connection add type ethernet con-name ens37 ifname ens37 autoconnect yes


5. nano /etc/sysconfig/network-scripts/ifcfg-ens37


6. 更改 ifcfg-ens37 ⽂件

TYPE=Ethernet

PROXY_METHOD=none

BROWSER_ONLY=no

BOOTPROTO=static

DEFROUTE=yes

IPV4_FAILURE_FATAL=no

IPV6INIT=yes

IPV6_AUTOCONF=yes

IPV6_DEFROUTE=yes

IPV6_FAILURE_FATAL=no

IPV6_ADDR_GEN_MODE=stable-privacy

NAME=ens37

UUID=59021522-3de9-492b-9308-b6ab7596aceb

DEVICE=ens37

ONBOOT=yes

IPADDR=10.227.x.1y6

NETMASK=255.255.254.0


注：


x：班级号，7班是2或8班是3


y：组号，1-10


service network start


![](https://img-blog.csdnimg.cn/direct/c332034da02d4012a6f9a706de7267be.png)


#### **·Hadoop101配置**


1. 打开 hadoop101完全分布式新增hadoop106节点.md 2023-12-18


2. nano /etc/hosts 加⼊


10.227.x.1y6 hadoop106


注：x：班级号，7班是2或8班是3；y：组号，1-10


3. nano $HADOOP\_HOME/etc/hadoop/workers 加⼊ hadoop106


4. ssh-copy-id -i ~/.ssh/id\_rsa.pub hadoop106


5. rsync -av


$HADOOP\_HOME/etc/hadoop root@hadoop106:/opt/module/hadoop-3.3.3/etc/


6. rsync -av /etc/hosts root@hadoop106:/etc


7. 远程到 hadoop106 ssh hadoop106


8. nano /opt/module/hadoop-3.3.3/etc/hadoop/hadoop-env.sh 修改 JAVA\_HOME export


JAVA\_HOME=/opt/module/jdk1.8.0\_341


### **3****.****启动集群**


1. jpsall.sh 中加⼊ hadoop106 nano ~/bin/jpsall.sh


![](https://img-blog.csdnimg.cn/direct/8babd7fbabe24f77abc86de751744419.png)


2.shutdown\_all.sh 中加⼊ hadoop106 nano ~/bin/shutdown\_all.sh


![](https://img-blog.csdnimg.cn/direct/16323fb10b78438fb2f2f5370f5f8f58.png)


3. 启动集群 myhadoop.sh start


4. 观察各节点进程的启动情况


![](https://img-blog.csdnimg.cn/direct/afd1f2a52bfd4da98e0e25529318f578.png)


![](https://img-blog.csdnimg.cn/direct/442c47112ff540bfa81c40abbb2a2e56.png)


![](https://img-blog.csdnimg.cn/direct/09fc60f3202a433281db30a58de4d09d.png)


### **4.个人配置中遇到的问题**


* #### **电脑没有vmnet8虚拟网卡**


编辑--->虚拟网络编辑器--->VMnet8--->还原默认设置--->NAT设置--->更改网关IP--->应用确定


设置 ---> 网络和Internet ---> 更改适配器选项 ---> 查看VMnet8，出现并显示已启用


* #### **Hadoop104、105DataNodeID缺失**


通过查找日志，在记录中找到了对应的节点的DataNode，然后我们进入到了103节点的$HADOOP\_HOME/data/dfs/data/current/VERSION目录下，复制了103节点的VERSION文件，然后分别进入到了104和105节点的$HADOOP\_HOME/data/dfs/data/current下，创建了VERSION文件，将从103中复制的内容粘贴到了新创建的文件中，并根据在日志中查找到的将其对应的DataNodeID，其内容如下(示例)：

storageID=DS-5c72e6f4-c180-44b4-9f26-6abc84327f43

clusterID=CID-fd0aa33f-424c-4212-a725-dd33a3ff126c

cTime=0

datanodeUuid=75809195-27bf-4c87-bb4d-8fb81642e7ae

storageType=DATA_NODE

layoutVersion=-57


其中，storageID会由系统自动生成，更改以后重新启动集群，集群数据接收正常


**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）**
![img](https://img-blog.csdnimg.cn/img_convert/fd269ed9577a8fb71828dc1bd9bc954b.png)

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

其中，storageID会由系统自动生成，更改以后重新启动集群，集群数据接收正常

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）
[外链图片转存中…(img-e8CTcEhF-1713129669762)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！