如何在同一台机器上搭建不同版本hadoop集群

时间Joyce

于 2021-08-02 10:53:02 发布

阅读量1k

点赞数

分类专栏：学习文章标签： hadoop

本文链接：https://blog.csdn.net/qq_27302777/article/details/119276737

版权

本文介绍了如何在同一台虚拟机上搭建不同版本的Hadoop集群，详细讲述了在尝试安装3.2.2版本时，由于误操作导致3.1.1集群数据丢失的过程。关键步骤包括修改hdfs-site.xml和mapred-site.xml配置文件，确保namenode和datanode的数据存储位置不同，并在重新安装时注意环境变量的设置。最后，作者强调了在虚拟环境中进行实验时保存快照的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、背景：原有的hadoop集群搭建在三台虚拟机上，版本为3.1.1

2、失败过程：打算在同一套虚拟机上安装一套hadoop-3.2.2，配置好相关配置文件之后，格式化namenode，终端打印信息询问是否要重新格式化namenode，对应的目录还是3.1.1版本的，这里我没注意看，选择了Y，导致原来hadoop-3.1.1的namenode目录（配置的是/opt/hdpdata/name）被格式化，原有hadoop集群数据被清空，且集群中datanode无法启动，原因是clusterID 不匹配了，在VERSION中修改之后，才完成启动。

2.1两套hadoop配置文件区别

1）修改 vim etc/hadoop/hdfs-site.xml文件

namenode datanode 存储数据的位置要不相同

<configuration>
   <!-- 集群的namenode的位置  datanode能通过这个地址注册-->
        <property>
             <name>dfs.namenode.rpc-address</name>
                 <value>linux01:8020</value>
        </property>
         <!-- namenode存储元数据的位置 -->