Hadoop系统应用之安装---Hadoop集群安装配置和详细搭建过程

-牧心-

已于 2023-04-10 15:24:09 修改

阅读量1.7k

点赞数

文章标签： hadoop linux 运维

于 2023-03-09 14:41:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57464618/article/details/129422223

版权

该文详细介绍了在虚拟机环境下，使用VMware和CentOS系统进行Hadoop集群的安装和配置过程，包括Linux系统安装、静态网络配置、SSH免密登录设置以及Hadoop相关环境变量配置和集群测试等步骤。

摘要由CSDN通过智能技术生成

实训课题

Hadoop集群安装配置和详细搭建过程

实验步骤:

一、虚拟机的安装部署

二、Linux系统安装部署

1.环境准备

2.系统安装

三、Centos系统安装

四、静态网络配置

五、虚拟机完整克隆配置

六、配置hosts文件和ssh免密登录

七、Hadoop集群配置

八、Hadoop集群测试

虚拟机的安装

（1）虚拟软件：VMware16

（2）VMMware版本：VMware Workstation 16 Pro

（3）vmware官方下载地址：https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html

（4）安装系统环境：Windows 10

Linux系统安装部署

（1）配置环境准备

Cento7镜像文件（尽量下载最小的版本）
资源网站：清华大学开源软件镜像站 | Tsinghua Open Source Mirror

（2）系统安装

2.1新建虚拟机并且选择安装程序光盘映像文件（iso）

2.2虚拟机配置如下

三、Centos7系统安装

3.1开启虚拟机

3.2安装Centos7系统

3.3进行配置

3.4进行登录

四、静态网络配置

4.1 检查网络的连通性

命令：ping www.baidu.com

4.2 打开ssh服务

4.2.1查看SSH是否安装 rpm -qa | grep ssh

Centos7 默认安装了ssh包

4.2.2安装缺失的包、并配置SSH yum install openssh*

完成！！！！

4.2.3注册使用服务，重启SSH服务
systemctl enable sshd
service sshd restart

4.3配置虚拟机的网络

4.4修改网络配置文件（ifcfg-ens33）

命令:vi /etc/sysconfig/network-scripts/ifcfg-ens33

Ps:如果配置完成后无法连通网络，添加centos7的mac地址到ifcfg-ens33中。

4.5 重启网络服务，查看配置是否成功

4.6重启虚拟机后，查看是否连通网络

命令：重启reboot ；查看ifconfig;检查ping www.baidu.com

五、虚拟机完整克隆配置

5.1克隆虚拟机

5.2修改主机名

5.3修改网络配置文件

5.4重新启动网络配置

六、配置hosts文件和ssh免密登录

1.修改hosts配置文件（所有虚拟机都需要配置此文件，此处只列举一台虚拟机）

命令：vi /etc/hosts

2.生成秘钥文件（四次回车）

命令:ssh-keygen -t rsa

3.将本机公钥文件复制到其它虚拟机上（接收方需先开机）

命令：ssh-copy-id yangjian01

ssh-copy-id yangjian02

ssh-copy-id yangjian03

ssh-copy-id yangjian00

4.上一步的命令在虚拟机yangjian00 yangjian01 yangjian02，yangjian03都需要执行，保证三台主机都能够免密登录

5.测试是否免密登录成功(ssh yangjian01)

成功！！！！

七、Hadoop集群配置

1.在所有centos7虚拟机根目录下新建文件夹export，export文件夹中新建data、servers和software文件

命令： mkdir -p /export/data

mkdir -p /export/servers

mkdir -p /export/software

2.准备安装包

3.下载安装软件SecureCRT和FX

4.利用FX将安装包传输到centos7虚拟机根目录下/export/software文件夹内

5.安装JDK（所有虚拟机都要配置）

5.1 解压JDK

cd /export/software

tar -zxvf jdk-8u144-linux-x64.tar.gz -C /export/servers/

5.2配置环境变量

编辑文件：vi /etc/profile

#tip:在配置文件末尾追加

export JAVA_HOME=/export/servers/ jdk-1.8.4-144

export PATH=$PATH:$JAVA_HOME/bin

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export JAVA_HOME PATH CLASSPATH

5.3 使配置文件生效

5.4 查看是否配置成功

6.安装Hadoop（所有虚拟机都要配置）

6.1 解压hadoop

cd /export/software

tar -zxvf hadoop-2.7.3.tar.gz -C /export/servers/

6.2 打开配置文件 vi/etc/profile

6.3 配置环境变量

#tip:在文件末尾追加

export HADOOP_HOME=/export/servers/hadoop-2.7.3

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

6.4 使配置文件生效

6.5查看是否配置成功

7.Hadoop集群配置

7.1 进入配置文件目录

命令：cd /export/servers/hadoop-2.7.3/etc/hadoop/

7.2 修改hadoop-env.sh文件

命令：vi hadoop-env.sh

#tip:找到相应位置，添加这段话

export JAVA_HOME=/export/servers/jdk-1.8.4-144

7.3 修改core-site.xml文件（命令：vi core-site.xml）

#tip:下图中乱码部分为注释代码，可以删掉，不影响

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://yangjian00:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/export/servers/hadoop-2.7.3/tmp</value>

</property>

</configuration>

7.4 修改hdfs-site.xml文件(命令：vi hdfs-site.xml)

<configuration>

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>yangjian01:50090</value>

</property>

</configuration>

7.5 修改mapred-site.xml文件(命令：vi mapred-site.xml)

7.5.1复制模板文件（命令：cp mapred-site.xml.template mapred-site.xml）

7.5.2编辑文件

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

7.6 修改yarn-site.xml文件(命令：vi yarn-site.xml)

<configuration>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

7.7修改slaves文件

7.8将主节点中配置好的文件和hadoop目录copy给子节点

#tip:这里主节点为yangjian00，子节点为yangjian01、yangjian02、yangjian03

scp /etc/profile yangjian01:/etc/profile

scp /etc/profile yangjian02:/etc/profile

scp /etc/profile yangjian03:/etc/profile

scp -r /export/ yangjian01:/

scp -r /export/ yangjian02:/

scp -r /export/ yangjian03:/

7.9使所有子节点的配置文件

7.10 在主节点格式化文件系统（successfully formatted 格式化成功）

八、Hadoop集群测试

1.启动集群服务

1.1在主节点启动所有HDFS服务进程（命令：start-dfs.sh）

1.2在主节点启动所有HDFS服务进程（命令：start-yarn.sh）

2.打开window下的C:\Windows\System32\drivers\etc打开hosts文件，在文件末添加三行代码：

192.168.220.20 yangjian00

192.168.220.21 yangjian01

192.168.220.22 yangjian02

192.168.220.23 yangjian03

3.通过UI界面查看Hadoop运行状态，在Windows系统下，访问http://hadoop01:50070，查看HDFS集群状态

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

-牧心- CSDN认证博客专家 CSDN认证企业博客

码龄4年

19: 原创

53万+: 周排名

207万+: 总排名

2万+: 访问

: 等级

218: 积分

26: 粉丝

16: 获赞

2: 评论

183: 收藏

私信

关注

热门文章

最新评论

Docker应用---Docker“容器”的常用使用操作
喰种汉尼拔: 大佬牛批
Docker应用---“容器数据卷”
CSDN-Ada助手: 非常棒的一篇博客！Docker的“容器数据卷”确实是一个非常重要的概念，也是Docker应用中的重要一环。期待你能为我们分享更多有关Docker的技术知识。建议下一篇博客可以深入探讨Docker网络概念及其应用，包括Docker网络类型、网络模式及其相关配置方法等内容。期待你的精彩分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
Hadoop系统应用之搭建Hadoop高可用集群
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN一周精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/615016098。
Hadoop系统应用之搭建Hadoop高可用集群
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614960525。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

-牧心- 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。