hadoop完全分布式搭建(2)

Java小生不才

已于 2022-08-14 22:20:03 修改

阅读量247

点赞数

分类专栏：大数据 VM Linux 文章标签： hadoop 分布式 hdfs

于 2022-07-10 22:20:59 首次发布

本文链接：https://blog.csdn.net/qq_41596346/article/details/125711572

版权

Linux 同时被 3 个专栏收录

23 篇文章 0 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

大数据

9 篇文章 0 订阅

订阅专栏

1.集群部署规划

	hadoop1	hadoop2	hadoop3
HDFS	NameNode,DataNode	DataNode	SecondaryNameNode,DataNode
YARN	NodeManager	ResourceManager,NodeManager	NodeManager

NameNode和SecondaryNameNode不在同一台服务器上
ResourceManager和NameNode,SecondaryNameNode不在同一台服务器上

2.在hadoop1上配置core-site.xml

hadoop-3.2.3/etc/hadoop/core-site.xml

<configuration>
  <!--指定NN的地址 -->
  <property>
     <name>fs.defaultFS</name>
     <value>hdfs://hadoop1:8020</value>
  </property>
  
  <!--指定hadoop数据存储目录 -->
  <property>
     <name>hadoop.tmp.dir</name>
     <value>/opt/software/hadoop-3.2.3/data</value>
  </property>
</configuration>

在这里插入图片描述

3.在hadoop1上配置hdfs-site.xml

hadoop-3.2.3/etc/hadoop/hdfs-site.xml

<configuration>
   <!-- nn web端访问地址 -->
  <property>
    <name>dfs.namenode.http-address</name>
    <value>hadoop1:9870</value>
  </property>

 <!-- 2nn web端访问地址 -->
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop3:9868</value>
  </property>
</configuration>

在这里插入图片描述

4.在hadoop1上配置yarn-site.xml

hadoop-3.2.3/etc/hadoop/yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
  <!-- 指定MR走shuffle  -->
  <property>
    <name>yarn.namemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  
   <!-- 指定RM的地址 -->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop2</value>
  </property>
</configuration>

在这里插入图片描述

5.在hadoop1上配置mapred-site.xml

hadoop-3.2.3/etc/hadoop/yarn-site.xml

<configuration>
   <!-- 指定MR程序运行在yarn上  -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

在这里插入图片描述

6.配置workers

hadoop-3.2.3/etc/hadoop/workers

hadoop1
hadoop2
hadoop3

主机名称后不能有空格
在这里插入图片描述
分发workers

xsync  workers

在这里插入图片描述

7.集群第一次启动格式化NameNode

hdfs namenode -format

在这里插入图片描述

8.启动HDFS

start-dfs.sh

在这里插入图片描述

9.启动YARN

在hadoop2上启动YARN

start-yarn.sh

在这里插入图片描述

10.集群崩溃的恢复

先杀进程(先yarn再dfs)，再删所有的data与logs，最后格式化即可
在这里插入图片描述

11.配置历史服务器

11.1.在mapred-site.xml中配置历史服务器相关信息

 <!-- 历史服务器地址 -->
   <property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop1:10020</value>
  </property> 
  
  <!-- 历史服务器web端地址 -->
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop1:19888</value>
  </property>

在这里插入图片描述

11.2.分发mapred-site.xml

xsync mapred-site.xml

在这里插入图片描述

11.3.启动历史服务器

bin/mapred --daemon start historyserver

在这里插入图片描述

Java小生不才

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop完全分布式搭建(2)

hadoop-3.2.3/etc/hadoop/core-site.xmlhadoop-3.2.3/etc/hadoop/hdfs-site.xmlhadoop-3.2.3/etc/hadoop/yarn-site.xmlhadoop-3.2.3/etc/hadoop/yarn-site.xmlhadoop-3.2.3/etc/hadoop/workers主机名称后不能有空格分发workers在hadoop2上启动YARN.........
复制链接

扫一扫

专栏目录