3.【hadoop集群搭建】配置Hadoop环境变量

最新推荐文章于 2025-01-31 16:45:37 发布

YANG_xiao_QI

最新推荐文章于 2025-01-31 16:45:37 发布

阅读量1.3w

点赞数 3

分类专栏： 1基于虚拟机.hadoop集群搭建（CentOS7）文章标签： hadoop 大数据

本文链接：https://blog.csdn.net/YANG_xiao_QI/article/details/109719888

版权

1基于虚拟机.hadoop集群搭建（CentOS7）专栏收录该内容

6 篇文章

订阅专栏

本文环境配置文件较多可以根据目录找到需要部分

1.配置hadoop-env.sh

(1)编辑hadoop-env.sh

vi  /hadoop/hadoop-2.6.0/etc/hadoop/hadoop-env.sh

(2)修改JAVA_HOME路径

注意：java_home指向的是你jdk的安装路径

export JAVA_HOME=/hadoop/jdk1.8.0_221

大概位置
在这里插入图片描述

如果忘记了一定要查看jdk安装所在的路径(安装vim命令yum install -y vim)

vim /etc/profile

2.配置yarn-env.sh

(1)编辑yarn-env.sh

vi  /hadoop/hadoop-2.6.0/etc/hadoop/yarn-env.sh

(2)修改JAVA_HOME路径

export JAVA_HOME=/hadoop/jdk1.8.0_221

大概位置
在这里插入图片描述

3.配置核心组件core-site.xml

1、创建hadoopdata目录，用于存放数据落地到本地服务器的磁盘位置

mkdir /hadoop/hadoopdata

2、编辑core-site.xml文件

vi /hadoop/hadoop-2.6.0/etc/hadoop/core-site.xml

3、配置文件中添加内容

<configuration>
<!-- 指定HDFS中NameNode的地址-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录-->
<property>
<name>hadoop.tmp.dir</name>
<value>/hadoop/hadoopdata</value>
#注意：文件的路径是否与之一致，不一致需修改（复制时这句话删除）
<description>Abasefor other temporary directories.</description>
</property>
</configuration>

大概位置
在这里插入图片描述

4.配置文件系统hdfs-site.xml

1.编辑hdfs-site.xml文件

vi /hadoop/hadoop-2.6.0/etc/hadoop/hdfs-site.xml

2.添加指定hdfs副本数量

<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>

大概位置
请添加图片描述

5.配置yarn-site.xml

vi /hadoop/hadoop-2.6.0/etc/hadoop/yarn-site.xml

添加

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value></property>
<property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

<property>
<name>yarn.resourcemanager.address</name><value>master:18040</value>
</property>

<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property>

<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:18025</value>
</property>

<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:18141</value>
</property>

<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property>
</configuration>

6.配置计算框架mapred-site.xml

1.创建mapred-site.xml文件

cp  /hadoop/hadoop-2.6.0/etc/hadoop/mapred-site.xml.template   /hadoop/hadoop-2.6.0/etc/hadoop/mapred-site.xml

2.编辑配置mapred-site.xml

vi  /hadoop/hadoop-2.6.0/etc/hadoop/mapred-site.xml

<configuration>
  <property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
  </property>
</configuration>

7.配置slave

vi /hadoop/hadoop-2.6.0/etc/hadoop/slaves

文件中添加以下内容：(一台master两台slave如下配置)

slave1
slave2

8.配置hadoop启动环境变量

1.编辑环境配置文件

#要知道hadoop的安装路径

vi /etc/profile

2.底部添加内容：

export HADOOP_HOME=/hadoop/hadoop-2.6.0
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS=-Djava.library.path=$HADOOP_HOME/lib
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH