hadoop伪分布式搭建（超详细）

@北惜

已于 2023-04-01 19:44:16 修改

阅读量3.5k

点赞数 18

分类专栏：大数据技术学习文章标签： hadoop 分布式 hdfs

于 2023-03-05 22:31:59 首次发布

本文链接：https://blog.csdn.net/beixige/article/details/129190624

版权

大数据技术学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

上一篇文章已经为大家介绍了如何在Linux系统上配置java环境，这为hadoop的集群搭建提供了基础条件，因为Hadoop是由Java编写的

如果还没有在虚拟机配置java系统的小伙伴可以先看一下我的第一篇文章:https://blog.csdn.net/beixige/article/details/129112527

接下来是hadoop伪分布搭建的要准备东西：
jdk1.8.0_221
hadoop-2.7.7
我都打包提供给大家了，下载地址：https://share.weiyun.com/dk7WgaVk
密码：553ubk

下面正式开始吧！

一.实现免密登陆

1. 创建ssh秘钥，输入如下命令，生成公私密钥

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

在这里插入图片描述

2.将master公钥id_dsa复制到master进行公钥认证，实现本机免密登陆，测试完exit退出

ssh-copy-id -i /root/.ssh/id_dsa.pub master
ssh master
exit

在这里插入图片描述

二.Hadoop环境的安装与配置

1. 将/root/runajian下的hadoop-2.7.7.tar.gz压缩包解压到/opt目录下，并将解压文件改名为hadoop

tar -zvxf /root/ruanjian/hadoop-2.7.7.tar.gz -C /opt
mv hadoop-2.7.7 hadoop

在这里插入图片描述

2.修改环境变量

vim /etc/profile

3.按键Shift+g键定位到最后一行，按键 i 切换到输入模式下，添加如下代码：

export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

在这里插入图片描述

4.按键ESC,按键:wq 保存并退出

5.生效刚刚的配置

source /etc/profile

在这里插入图片描述

6.编辑/opt/hadoop/etc/hadoop/hadoop-env.sh文件，操作如下:

vi /opt/hadoop/etc/hadoop/hadoop-env.sh

在这里插入图片描述

7. 按键 :set nu 回车设置行号

在这里插入图片描述

8.按键25gg定位到25行，部分截图如下:

在这里插入图片描述

9.按键dd删除此行，部分截图如下:

在这里插入图片描述

10.按键i，插入以下代码，注：根据自己的java路径而定

export JAVA_HOME=/opt/java

在这里插入图片描述

11.按键ESC 按键:wq 回车保存并退出

12.编辑/opt/hadoop/etc/hadoop/core-site.xml文件，部分截图如下：

vi /opt/hadoop/etc/hadoop/core-site.xml

在这里插入图片描述

13. 按键 :set nu 回车设置行号

在这里插入图片描述

14.按键19gg定位到19行，按键o添加如下代码，部分截图如下

<property>
<name>fs.defaultFS</name>
<value>hdfs://master</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/tmp</value>
</property>

在这里插入图片描述

15.按键Esc,按键:wq保存退出

16.编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件,部分截图如下

vi /opt/hadoop/etc/hadoop/hdfs-site.xml

在这里插入图片描述

17. 按键 :set nu 回车设置行号

在这里插入图片描述

18.按键20gg定位到20行，按键i添加如下代码

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

在这里插入图片描述

19.按键Esc,按键:wq保存退出

20.复制/opt/hadoop/etc/hadoop/mapred-site.xml.tmplate 名为mapred-site.xml

cp /opt/hadoop/etc/hadoop/mapred-site.xml.template /opt/hadoop/etc/hadoop/mapred-site.xml

在这里插入图片描述

21.编辑/opt/hadoop/etc/hadoop/mapred-site.xml文件,部分截图如下

vi /opt/hadoop/etc/hadoop/mapred-site.xml

在这里插入图片描述

22.按键:set nu回车，设置行号

在这里插入图片描述

23.按键20gg定位到20行,按键i添加如下代码

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

在这里插入图片描述

24.按键Esc,按键:wq保存退出

25.编辑/opt/hadoop/etc/hadoop/yarn-site.xml文件,部分截图如下:

vi /opt/hadoop/etc/hadoop/yarn-site.xml

在这里插入图片描述

26.按键:set nu回车，设置行号

在这里插入图片描述

27.按键18gg定位到18行,按键i添加如下代码，部分截图如下

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

在这里插入图片描述

28.按键Esc,按键:wq保存退出

29.编辑/opt/hadoop/etc/hadoop/slaves文件

vim /opt/hadoop/etc/hadoop/slaves

在这里插入图片描述

30.按键dd删除首行，按键i添加如下内容

master

在这里插入图片描述

31.按键Esc,按键:wq保存退出

32.切换到机器上，命令行中执行如下指令，格式化hdfs，部分截图如下

hdfs namenode -format

在这里插入图片描述

33.机器命令行中执行如下指令,启动集群，启动过程中出现“are you sure you want to continue connecting”，输入yes。

start-all.sh

在这里插入图片描述

34.机器命令行中执行如下指令,查看进程

jps

在这里插入图片描述

35.如上图所示，所有配置完成，进程启动完毕

ps:连续三晚5000+字教程不易，如果对正在看的小伙伴们有帮助恳请留下一赞~

@北惜

关注

18
点赞
踩
65

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录