3.1、环境变量设置,将JAVA变量增加到hadoop变量中
3.5、配置mapred-site.xml,指定job在yarn上运行
4.1、格式化namenode (第一次启动前进行格式化,之后尽量不要格式化)
4.3、启动resourcemanager、nodemanager
序:相关软件版本
- VMware:VMware-15.5.1
- Linux:CentOS-7.5-x86_64-DVD-1804.iso
- JDK:jdk-8u212-linux-x64.tar.gz
- Hadoop:hadoop-3.1.3.tar.gz
一、前期准备
- 准备一台服务器
- 服务器静态ip创建
- 服务器关闭防火墙
- 服务创建新用户,并在/opt/目录下创建两个目录:module,software。并将两个目录拥有者转给新用户
- 安装好jdk及hadoop,并配好环境变量
二、需要修改的配置
- hadoop-env.sh (hodoop 3.1.3/etc/hodoop/hadoop-env.sh)需配置JAVA_HOME
- core-site.xml
- hdfs-site.xml
- yarn-site.xml
- mapred-site.xml
三、配置修改过程
3.1、环境变量设置,将JAVA变量增加到hadoop变量中
位置:/opt/module/hadoop 3.1.3/etc/hadoop/hadoop-env.sh
# The java implementation to use. By default, this environment
# variable is REQUIRED on ALL platforms except OS X!
# export JAVA_HOME=
# 增加以下内容
export JAVA_HOME=/opt/module/jdk1.8.0_212
3.2、配置core-site.xml
位置:/opt/module/hadoop 3.1.3/etc/hadoop/core-site.xml
<configuration>
<!-- 增加以下内容 -->
<!-- 指定HDFS中NameNode的地址,指定集群之间交互的端口号 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop101:9820</value>
</property>
<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/module/hadoop-3.1.3/data/tmp</value>
</property>
</configuration>