Hadoop集群部署

最新推荐文章于 2024-08-04 13:23:56 发布

qq_58647543

最新推荐文章于 2024-08-04 13:23:56 发布

阅读量128

点赞数

文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58647543/article/details/134512364

版权

任务描述

本关任务：在右侧命令行中完成 Hadoop 集群的部署，安装和管理。

相关知识

为了完成本关任务，你需要掌握： 1.主机映射； 2.免密登录； 3.安装JDK； 4.Hadoop 完全分布式搭建。

主机映射

先查看各节点查看 ip 地址

master：

图 1

查看 master 节点 IP

slave1：

图 1

查看 slave1 节点 IP

slave2：

图 1

查看 slave2 节点 IP

接下来去设置主机映射，因为我们是搭建完全分布式，所以在设置映射的时候需要设置 3 台虚拟机的映射关系。

输入命令 vi /etc/hosts进行主机 ip 的映射设置，添加如下配置：

#master、slave1、slave2
172.16.248.174 master
172.16.251.34 slave1
172.16.240.174 slave2

注：需要根据自身节点 ip 地址去配置，每次重置环境会刷新 ip 地址。

图 1

配置主机映射

操作示意图如下：

图 1

主机映射操作示意图

免密登录

在各节点服务器生成秘钥：

#master、slave1、slave2
ssh-keygen -t rsa

在 master 复制 master、slave1、slave2 的公钥。

cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
ssh slave1 cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
ssh slave2 cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys

接下来来查看下 slave1 节点连接密码，首先点击 slave1 命令行窗口，再点击右上角

图标，最后点击 SSH 直连即可查看相关信息，如下示意图：

点开后，查看密码：

注：密码可双击选中后复制，但环境重置后密码会随机生成。

在 slave1 复制 master 的 authorized_keys 文件。

ssh master cat ~/.ssh/authorized_keys>> ~/.ssh/authorized_keys

在 slave2 复制 master 的 authorized_keys 文件。

ssh master cat ~/.ssh/authorized_keys>> ~/.ssh/authorized_keys

操作示意图如下：

图 1

免密登录操作示意图

安装 JDK

解压

首先在右侧命令行中创建一个/app文件夹，我们之后的软件都将安装在该目录下。命令：mkdir /app

然后，切换到/opt目录下，来查看一下提供的压缩包

可以看到我们已经帮你下载好了 JDK 的安装文件。

现在我们解压 JDK 并将其移动到/app目录下

tar -zxvf jdk-8u11-linux-x64.tar.gz mv jdk1.8.0_11/ /app

可以切换到/app目录下查看解压好的文件夹

配置环境变量

解压好 JDK 之后还需要在环境变量中配置 JDK ，才可以使用，接下来就来配置 JDK 。输入命令：vim /etc/profile 编辑配置文件；

在文件末尾输入如下代码:

最后：source /etc/profile使刚刚的配置生效

输入：java -version 出现如下界面代表配置成功。

在 slave1 和 slave2 节点各创建一个/app文件夹命令：mkdir /app

将解压好的 JDK 与配置文件通过 scp 命令发送至 slave1、slave2 中

#发送 JDK
scp -r /app/jdk1.8.0_11 root@slave1:/app
scp -r /app/jdk1.8.0_11 root@slave2:/app
#发送配置文件
scp /etc/profile root@slave1:/etc/
scp /etc/profile root@slave2:/etc/

在各节点上分别执行source /etc/profile，使配置文件生效。

操作示意图如下：

图 1

安装 JDK 操作示意图

Hadoop 完全分布式搭建

下面对 Hadoop 的压缩包进行解压，我们切换到 /bigfiles目录下：cd /data/bigfiles/ 可看到所提供的的压缩包。

解压文件并移动到/app目录下。 tar -zxvf hadoop-3.1.0.tar.gz -C /app

切换到\app目录下修改一下 hadoop 文件夹的名字。 mv hadoop-3.1.0/ hadoop3.1

接下来我们要开始修改 Hadoop 的配置文件了，总共需要修改6个文件。分别是：

hadoop-env.sh； yarn-env.sh ； core-site.xml； hdfs-site.xml； mapred-site.xml； yarn-site.xml。

我们一个一个接着来配置吧！

hadoop-env.sh 配置

两个env.sh文件主要是配置 JDK 的位置。

首先我们切换到 hadoop 目录下

cd /app/hadoop3.1/etc/hadoop/

编辑vi hadoop-env.sh 在文件中插入如下代码：

# The java implementation to use.
#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/app/jdk1.8.0_11

yarn-env.sh 配置

编辑vi yarn-env.sh 插入如下代码：

export JAVA_HOME=/app/jdk1.8.0_11

core-site.xml配置

这个是核心配置文件我们需要在该文件中加入 HDFS 的 URI 和 NameNode 的临时文件夹位置，这个临时文件夹在下文中会创建。

在文件末尾的 configuration 标签中添加代码如下：

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
<description>HDFS的URI，文件系统://namenode标识:端口号</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/tmp</value>
<description>namenode上本地的hadoop临时文件夹</description>
</property>
</configuration>

hdfs-site.xml文件配置

replication指的是副本数量，我们现在是单节点，所以是1

<configuration>
<property>
<name>dfs.name.dir</name>
<value>/usr/hadoop/hdfs/name</value>
<description>namenode上存储hdfs名字空间元数据 </description>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/hadoop/hdfs/data</value>
<description>datanode上数据块的物理存储位置</description>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

mapred-site.xml文件配置

mapred-site.xml包括 JobHistoryServer 和应用程序参数两部分,在文件末尾的configuration标签中添加代码如下：

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

yarn-site.xml配置

Yarn 的站点配置文件是 yarn-site.xml，将以下代码填充到文件的末尾的configuration标签中。

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>192.168.2.10:8099</value>
<description>这个地址是mr管理界面的</description>
</property>
</configuration>

创建文件夹

我们在配置文件中配置了一些文件夹路径，现在我们来创建他们，在/usr/hadoop/目录下使用hadoop用户操作，建立tmp、hdfs/name、hdfs/data目录，执行如下命令：

mkdir -p /usr/hadoop/tmp
mkdir /usr/hadoop/hdfs
mkdir /usr/hadoop/hdfs/data
mkdir /usr/hadoop/hdfs/name

将Hadoop添加到环境变量中

vim /etc/profile

在文件末尾插入如下代码：

最后使修改生效：source /etc/profile

格式化

在使用 Hadoop 之前我们需要格式化一些 hadoop 的基本信息。

使用如下命令：

hadoop namenode -format

出现如下界面代表成功：

操作示意图如下：

图 1

Hadoop 完全分布式搭建

启动Hadoop

接下来我们启动 Hadoop,在/hadoop3.1/sbin路径下: cd /app/hadoop3.1/sbin

将start-dfs.sh，stop-dfs.sh两个文件顶部添加以下参数:

#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

还有，start-yarn.sh，stop-yarn.sh顶部也需添加以下：

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

再次启动start-dfs.sh，最后输入命令 jps 验证,出现如下界面代表启动成功：

发送 Hadoop 至另外两台虚拟机

scp -r /app/hadoop3.1 root@slave1:/app
scp -r /app/hadoop3.1 root@slave2:/app

发送配置文件至另外两台虚拟机

scp /etc/profile root@slave1:/etc/
scp /etc/profile root@slave2:/etc/

在各节点上source /etc/profile，使配置文件生效。

至此，Hadoop 集群的部署已全部完成。

操作示意图如下：

图 1

启动 Hadoop 操作示意图

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_58647543 CSDN认证博客专家 CSDN认证企业博客

码龄3年

68: 原创

58万+: 周排名

2万+: 总排名

4万+: 访问

: 等级

1106: 积分

294: 粉丝

409: 获赞

14: 评论

412: 收藏

私信

关注

热门文章

分类专栏

linux 5篇
hadoop 2篇
MySQL 4篇
TiDB 8篇
数据库导出 1篇
minio 1篇
git 1篇
docker 11篇
hive 1篇
spark 9篇
redis 3篇
python 6篇
计算机二级等级考试 4篇
词云 1篇
wordcould 1篇

最新评论

VMware Workstation 虚拟机网络配置为与主机使用同一网络
qq_58647543: https://blog.csdn.net/qq_58647543/article/details/140317658 看看这个对你有帮助吗？
VMware Workstation 虚拟机网络配置为与主机使用同一网络
qq_58647543: 虚拟网络配置问题虚拟机的网络配置模式会影响虚拟机和主机之间的通信方式。如果使用了 NAT 模式，虚拟机通过主机的网络访问外网，但默认情况下虚拟机和主机可能无法直接通信 NAT 模式更改为桥接模式
VMware Workstation 虚拟机网络配置为与主机使用同一网络
遥枫: 楼主，虚拟机是WINDOWS系统，主机也是WINDOWS系统，我的主机Ping通虚拟机，但是虚拟机Ping不通我的主机，主机是192.168.137.183，虚拟机是 192.168.137.83，但是虚拟机可以联网（访问百度），用的就是我的本地的网络。问题：为啥虚拟机Ping不通我的主机地址？192.168.137.183
如何将SQL文件导入MySQL数据库
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
Hadoop集群部署
CSDN-Ada助手: 恭喜您写了第15篇博客，标题为“Hadoop集群部署”。非常高兴看到您对Hadoop集群的部署有如此深入的了解，并愿意与大家分享您的经验。您的博客内容对于那些希望学习如何部署Hadoop集群的读者来说一定非常有帮助。在下一步的创作中，我建议您继续关注Hadoop相关的主题，比如如何优化集群性能、解决常见故障等等。或者您可以分享一些实际案例，展示Hadoop集群在解决大数据问题方面的应用。这些内容将进一步丰富您的博客，并吸引更多读者。再次恭喜您的持续创作，期待您未来更多的精彩博文！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。