Hadoop环境安装

code@fzk

已于 2024-02-20 16:46:19 修改

阅读量166

点赞数

分类专栏：大数据文章标签：大数据 hadoop

于 2021-08-09 19:09:17 首次发布

本文链接：https://blog.csdn.net/qq_44002865/article/details/119447135

版权

大数据专栏收录该内容

25 篇文章 0 订阅

订阅专栏

Hadoop分布式环境

0、前期准备

创建普通用户

# 创建 fzk 用户
useradd fzk
# 修改 fzk 用户的密码
passwd fzk
# 配置 fzk 用户具有 root 权限，方便后期加 sudo 执行 root 权限的命令（/etc/sudoers文件，%wheel 下面添加）
fzk     ALL=(ALL)       NOPASSWD:ALL

ssh免密登录

参考文档：https://blog.csdn.net/u010698107/article/details/119079821

# 生成公钥和私钥
ssh-keygen -t rsa

# 将公钥拷贝到要免密登录的目标机器上
ssh-copy-id hadoop152

1、分布式基本环境搭建

集群部署规划

	hadoop151	hadoop152	hadoop153
HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

环境搭建步骤

第一步：准备 3 台客户机（关闭防火墙、静态 IP、主机名称）

192.168.37.151 hadoop151
192.168.37.152 hadoop152
192.168.37.153 hadoop153
第二步：安装 JDK 、安装 Hadoop 、配置环境变量

第三步：修改配置文件

hadoop-env.sh 、core-site.xml 、hdfs-site.xml 、yarn-site.xml 、mapred-site.xml 、workers 、hdfs

etc/hadoop/hadoop-env.xml

export JAVA_HOME=/opt/software/jdk/jdk1.8.0_281
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
export HADOOP_SECURE_DN_USER=root

etc/hadoop/core-site.xml

<configuration>
    <!-- 指定 NameNode 的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop151:8020</value>
    </property>
    <!-- 指定 hadoop 数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/software/hadoop/data</value>
    </property>
    <!-- 配置 HDFS 网页登录使用的静态用户为 root -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>root</value>
    </property>
</configuration>

etc/hadoop/hdfs-site.xml

<configuration>
    <!-- NameNode web 端访问地址-->
    <property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop151:9870</value>
    </property>
    <!-- SecondaryNameNode web 端访问地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop153:9868</value>
    </property>
</configuration>

etc/hadoop/yarn-site.xml

<configuration>
    <!-- 指定 MapReduce 走 shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!-- 指定 ResourceManager 的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop152</value>
    </property>
    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

etc/hadoop/mapred-site.xml

<configuration>
    <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

etc/hadoop/workers
```
hadoop151
hadoop152
hadoop153
```

bin/hdfs

// 将 HADOOP_SHELL_EXECNAME="hdfs" 改成
HADOOP_SHELL_EXECNAME="root"

启动集群

第一步：如果集群是第一次启动，需要在 hadoop151 节点格式化 NameNode
- 命令：hdfs namenode -format
- 注意：格式化 NameNode，会产生新的集群 id，导致 NameNode 和 DataNode 的集群 id 不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化 NameNode 的话，一定要先停止 namenode 和 datanode 进程，并且要删除所有机器的 data 和 logs 目录，然后再进行格式化。
第二步：在配置了NameNode节点的机器上启动HDFS
- 命令：sbin/start-dfs.sh
第三步：在配置了ResourceManager节点的机器启动YARN没
- 命令：sbin/start-yarn.sh
第四步：Web 端查看 HDFS 的 NameNode
- http://192.168.37.151:9870
第五步：Web 端查看 YARN 的 ResourceManager
- http://192/168.37.152:8088

2、配置历史服务器和日志的聚集

环境搭建

第一步：搭建出分布式基本环境

第二步：在 /etc/hadoop/mapred-site.xml 中添加以下配置，并将改文件复制到另外两个主机中

	<!-- 历史服务器端地址 -->
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop151:10020</value>
    </property>
    <!-- 历史服务器 web 端地址 -->
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop151:19888</value>
    </property>

第三步：在 /etc/hadoop/yarn-site.xml 中添加以下配置，并将改文件复制到另外两个主机中

    <!-- 开启日志聚集功能 -->
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
    <!-- 设置日志聚集服务器地址 -->
    <property>
        <name>yarn.log.server.url</name>
        <value>http://hadoop151:19888/jobhistory/logs</value>
    </property>
    <!-- 设置日志保留时间为 7 天 -->
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>

启动

在配置了JobHistory节点的机器上启动
- mapred --daemon start historyserver
Web 端查看 JobHistory
- http://192.168.37.151:19888/jobhistory

3、集群启动/停止方式总结

各个模块分开启动/停止（配置ssh 是前提）

整体启动/停止 HDFS
- start-dfs.sh
- stop-dfs.sh
整体启动/停止 YARN
- start-yarn.sh
- stop-yarn.sh

各个服务组件逐一启动/停止

分别启动/停止 HDFS 组件
- hdfs --daemon start/stop namenode/datanode/secondarynamenode
启动/停止 YARN
- yarn --daemon start/stop resourcemanager/nodemanager
启动/停止 JobHistory
- mapred --daemon start/stop historyserver

4、编写 Hadoop 集群常用脚本

Hadoop 集群启停脚本

启动HDFS，Yarn，Historyserver：myhadoop.sh

#!/bin/bash
if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi

case $1 in
"start")
    echo " =================== 启动 hadoop 集群 ==================="
    echo " --------------- 启动 hdfs ---------------"
    ssh hadoop151 "start-dfs.sh"
    echo " --------------- 启动 yarn ---------------"
    ssh hadoop152 "start-yarn.sh"
    echo " --------------- 启动 historyserver ---------------"
    ssh hadoop151 "mapred --daemon start historyserver"
    ;;
"stop")
    echo " =================== 关闭 hadoop 集群 ==================="
    echo " --------------- 关闭 historyserver ---------------"
    ssh hadoop151 "mapred --daemon stop historyserver"
    echo " --------------- 关闭 yarn ---------------"
    ssh hadoop152 "stop-yarn.sh"
    echo " --------------- 关闭 hdfs ---------------"
    ssh hadoop151 "stop-dfs.sh"
    ;;
*)
	echo "Input Args Error..."
	;;
esac

查看三台服务器 Java 进程脚本

jps：jpsall.sh

#!/bin/bash
for host in hadoop151 hadoop152 hadoop153
do
    echo =============== $host ===============
    ssh $host jps 
done

5、常用端口号说明

端口名称	Hadoop2.x	Hadoop3.x
NameNode 内部通信端口	8020 / 9000	8020 / 9000 / 9820
NameNode HTTP UI	50070	9870
MapReduce 查看执行任务端口	8088	8088
历史服务器通信端口	19888	19888

6、高可用环境搭建（HA）

集群规划

hadoop151	hadoop152	hadoop153
NameNode	NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
ZK	ZK	ZK
ResourceManager	ResourceManager
NodeManager	NodeManager	NodeManager

配置 HDFS-HA 集群

第一步：core-site.xml 配置文件内容

    <!-- 把NameNode的地址组装成一个集群mycluster -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <!-- 指定hadoop运行时产生文件的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/software/hadoop/hadoop-3.1.4/data/tmp</value>
    </property>
    <!-- 声明journalnode服务器存储目录-->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/software/hadoop/hadoop-3.1.4/data/tmp/journalnode</value>
    </property>

第二步：hdfs-site.xml 配置文件内容

    <!-- 完全分布式集群名称 -->
    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>
    <!-- 集群中NameNode节点都有哪些 -->
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2,nn3</value>
    </property>
    <!-- nn1,nn2,nn3的RPC通信地址 -->
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>hadoop151:8020</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>hadoop152:8020</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn3</name>
        <value>hadoop153:8020</value>
    </property>
    <!-- nn1,nn2,nn3的http通信地址 -->
    <property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>hadoop151:9870</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>hadoop152:9870</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn3</name>
        <value>hadoop153:9870</value>
    </property>
    <!-- 指定NameNode元数据在JournalNode上的存放位置 -->
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://hadoop151:8485;hadoop152:8485;hadoop153:8485/mycluster</value>
    </property>
    <!-- 访问代理类：client，mycluster，active配置失败自动切换实现方式-->
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <!-- 关闭权限检查（公司是不允许关闭的，公司需要配置，具体配置参考官网） -->
    <property>
        <name>dfs.permissions.enable</name>
        <value>false</value>
    </property>
    <!-- 配置隔离机制，即同一时刻只能有一台服务器对外响应 -->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <!-- 使用隔离机制时需要ssh无秘钥登录-->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_rsa</value>
    </property>

第三步：将 core-site.xml 和 hdfs-site.xml 两个文件分发的其他机器上，scp
第四步：在所有集群中启动 JournalNode
- hdfs --daemon start journalnode
第五步：在其中一个节点中格式化 NameNode
- hdfs namenode -format
第六步：将NameNode元数据目录的内容复制到其他未格式化的NameNode
- hdfs namenode -bootstrapStandby
第七步：在所有节点中启动 NameNode 和 DataNode
- hdfs --daemon start namenode
- hdfs --daemon start datanode
第八步：将其中一个节点设为 Active 状态（例如将 nn1 设为 Active状态）
- hdfs haadmin -transitionToActive nn1

配置Zookeeper集群

在hadoop151、hadoop152和hadoop153三个节点上部署Zookeeper

第一步：安装jdk
第二步：拷贝Zookeeper文件到Linux并解压
第三步：在Zookeeper安装目录下创建 zkData 目录，目的是存储数据
第四步：在 zkData 目录下创建 myid 文件，目的是为了区分Zookeeper
- hadoop151、hadoop152、hadoop153 三台集群的 myid 文件里分别写入 1、2、3

第四步：将**/Zookeeper安装路径/conf**路径下的 zoo_sample.cfg 文件拷贝一份为 zoo.cfg 并修改

# 修改数据存储路径配置
dataDir=/zookeeper安装路径/zkData

# 添加Zookeeper集群配置
# 格式：server.A=B:C:D
# A是一个数字，集群模式下配置文件myid的数字，表示这个是第几号服务器
# B是这个服务器的ip地址
# C是这个服务器与集群中的Leader服务器交换信息的端口
# D是集群的Leader服务器挂了，重新选出新的Leader，选举时服务器相互通信的端口
server.1=hadoop151:2888:3888
server.2=hadoop152:2888:3888
server.3=hadoop153:2888:3888

第五步：将整个安装的 zookeeper目录分发到 hadoop152和hadoop153机器上
第六步：将 hadoop151、hadoop152、hadoop153 三台集群的 myid 文件的数字分别改成 1、2、3
第七步：在三台机器上分别启动Zookeeper
- bin/zkServer.sh start
第八步：查看状态，一台机器状态为 Mode: leader，另外两台机器状态为 Mode: follower
- bin/zkServer.sh status

配置 HDFS-HA 集群

第一步：在 hdfs-site.xml 添加配置内容

    <!-- 开启自动故障转移 -->
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>

第二步：在 core-site.xml 添加配置内容

    <!-- 指定自动故障转移的集群配置 -->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>hadoop151:2181,hadoop152:2181,hadoop153:2181</value>
    </property>

第三步：hadoop-env.sh 配置文件

export JAVA_HOME=/opt/software/jdk/jdk1.8.0_281
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
export HADOOP_SECURE_DN_USER=root
export HDFS_ZKFC_USER=root
export HDFS_JOURNALNODE_USER=root

第四步：将 core-site.xml 、 hdfs-site.xml 、hadoop-env.sh 三个文件分发的其他机器上，scp
第五步：在三台机器上分别启动Zookeeper
- bin/zkServer.sh start
第六步：初始化 ZKFC
- hdfs zkfc -formatZK
第七步：启动集群
- start-dfs.sh

第八步：查看进程是否都启动了，六个进程

Jps
QuorumPeerMain
NameNode
DataNode
JournalNode
DFSZKFailoverController

配置 YARN-HA 集群

第一步：yarn-site.sh 配置

    <!-- 指定 MapReduce 走 shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!--启用ResourceManager ha-->
    <property>
        <name>yarn.resourcemanager.ha.enabled</name>
        <value>true</value>
    </property>
    <!--声明两台ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.cluster-id</name>
        <value>cluster1</value>
    </property>
    <property>
        <name>yarn.resourcemanager.ha.rm-ids</name>
        <value>rm1,rm2</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname.rm1</name>
        <value>hadoop151</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname.rm2</name>
        <value>hadoop152</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address.rm1</name>
        <value>hadoop151:8088</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address.rm2</name>
        <value>hadoop152:8088</value>
    </property>
    <!--指定zookeeper集群的地址-->
    <property>
        <name>hadoop.zk.address</name>
        <value>hadoop151:2181,hadoop152:2181,hadoop153:2181</value>
    </property>
    <!--启用自动恢复--> 
    <property>
        <name>yarn.resourcemanager.recovery.enabled</name>
        <value>true</value>
    </property>
    <!-- 环境变量的继承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
    <!-- 开启日志聚集功能 -->
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
    <!-- 设置日志保留时间为 7 天 -->
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>

第二步：将 yarn-site.xml 文件分发的其他机器上，scp
第三步：启动yarn（前提是Zookeeper和hdfs都启动了）
- start-yarn.sh

安装完后集群启动和停止集群

启动

第一步：在三台机器上分别启动Zookeeper
- bin/zkServer.sh start
第二步：在任意一台启动 NameNode、DataNode、JournalNode、ZKCF等等
- start-all.sh

停止

第一步：在任意一台启动 NameNode、DataNode、JournalNode、ZKCF等等
- stop-all.sh
第二步：在三台机器上分别启动Zookeeper
- bin/zkServer.sh stop

code@fzk

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop环境安装

Hadoop分布式环境文章目录Hadoop分布式环境0、前期准备创建普通用户ssh免密登录1、分布式基本环境搭建集群部署规划环境搭建步骤启动集群2、配置历史服务器和日志的聚集环境搭建启动3、集群启动/停止方式总结各个模块分开启动/停止（配置ssh 是前提）各个服务组件逐一启动/停止4、编写 Hadoop 集群常用脚本Hadoop 集群启停脚本查看三台服务器 Java 进程脚本5、常用端口号说明6、高可用环境搭建（HA）集群规划配置 HDFS-HA 集群配置Zookeeper集群配置 HDFS-HA 集群配
复制链接

扫一扫