最全hadoop完全分布式搭建（学不会干我）(1)

2401_84182936

于 2024-05-04 14:48:52 发布

阅读量275

点赞数 4

分类专栏：程序员文章标签：分布式 hadoop 大数据

本文链接：https://blog.csdn.net/2401_84182936/article/details/138441835

版权

程序员专栏收录该内容

126 篇文章 1 订阅

订阅专栏

上一章文章必看：连接Hadoop3.x搭建（1）伪分布式【学不会我直接躺下】-CSDN博客

搭建总体思路：

完全分布式的搭建

在上一章中我们搭建了伪分布式，这一章搭建完全分布式

首先拍摄伪分布的快照

！！！！！！！！！每台节点都需要拍摄快照！！！！！！！！！！！！！！！！！！！！！！

然后恢复到搭建伪分布之前的那个快照，这个快照里面是没有hadoop的，所以要将hadoop重新通过xftp传入/opt下（上一章有就不重复展示了）

接下来连接xshell，解压hadoop并mv 更名为hadoop，进入配置文件

 cd hadoop/etc/hadoop/

vim core-site.xml

<!-- 指定NameNode的地址和端口 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:8020</value>
    </property>
 
    <!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoop/data</value>
    </property>
 
    <!-- 配置HDFS网页登录使用的静态用户为root -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>root</value>
    </property>

vim hadoop-env.sh

export JAVA_HOME=/opt/java

vim hdfs-site.xml

<!--web 端访问地址-->

<property>

 <name>dfs.namenode.http-address</name>

 <value>master:9870</value>

 </property>

<!--web 端访问地址-->

 <property>

 <name>dfs.namenode.secondary.http-address</name>

 <value>slave1:9868</value>

 </property>

vim workers

vim yarn-site.xml

<!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
</property>
 <property>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>master:8088</value>
    <description>指定 ResourceManager 的 Web 应用连接地址</description>
  </property>

<property> 
<name>yarn.resourcemanager.address</name> 
<value>master:8032</value> 
</property> 
<property> 
<name>yarn.resourcemanager.scheduler.address</name> 指定 ResourceManager 的调度器连接地址
<value>master:8030</value> 
</property> 
<property> 
<name>yarn.resourcemanager.resource-tracker.address</name> 
<value>master:8031</value> 
</property> 

<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
 <property>
      
  <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>false</value>
    </property>

    <property>
       <name>yarn.nodemanager.vmem-check-enabled</name>
       <value>false</value>
    </property>
    <!-- 环境变量的继承 -->
    <property>

        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>



<!-- 开启日志聚集功能 -->
	<property>
		<name>yarn.log-aggregation-enable</name>
		<value>true</value>
	</property>
	<!-- 设置日志聚集服务器地址 -->
	<property>  

		<name>yarn.log.server.url</name>  
		<value>http://master:19888/jobhistory/logs</value>
	</property>
	<!-- 设置日志保留时间为7天 -->
	<property>
		<name>yarn.log-aggregation.retain-seconds</name>
		<value>604800</value>
	</property>

vim mapred-site.xml

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
<!-- 历史服务器端地址 -->
	<property>
		<name>mapreduce.jobhistory.address</name>
		<value>master:10020</value>
	</property>
 
	<!-- 历史服务器web端地址 -->
	<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>master:19888</value>
	</property>