hadoop伪分布式搭建(超详细)

上一篇文章已经为大家介绍了如何在Linux系统上配置java环境,这为hadoop的集群搭建提供了基础条件,因为Hadoop是由Java编写的

如果还没有在虚拟机配置java系统的小伙伴可以先看一下我的第一篇文章:https://blog.csdn.net/beixige/article/details/129112527

接下来是hadoop伪分布搭建的要准备东西:
jdk1.8.0_221
hadoop-2.7.7
我都打包提供给大家了,下载地址:https://share.weiyun.com/dk7WgaVk
密码:553ubk

下面正式开始吧!

一.实现免密登陆
1. 创建ssh秘钥,输入如下命令,生成公私密钥
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

在这里插入图片描述

2.将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出
ssh-copy-id -i /root/.ssh/id_dsa.pub master
ssh master
exit

在这里插入图片描述

二.Hadoop环境的安装与配置
1. 将/root/runajian下的hadoop-2.7.7.tar.gz压缩包解压到/opt目录下,并将解压文件改名为hadoop
tar -zvxf /root/ruanjian/hadoop-2.7.7.tar.gz -C /opt
mv hadoop-2.7.7 hadoop

在这里插入图片描述

2.修改环境变量
vim /etc/profile
3.按键Shift+g键定位到最后一行,按键 i 切换到输入模式下,添加如下代码:
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

在这里插入图片描述

4.按键ESC,按键:wq 保存并退出
5.生效刚刚的配置
source /etc/profile

在这里插入图片描述

6.编辑/opt/hadoop/etc/hadoop/hadoop-env.sh文件,操作如下:
vi /opt/hadoop/etc/hadoop/hadoop-env.sh

在这里插入图片描述

7. 按键 :set nu 回车设置行号

在这里插入图片描述

8.按键25gg定位到25行,部分截图如下:

在这里插入图片描述

9.按键dd删除此行,部分截图如下:

在这里插入图片描述

10.按键i,插入以下代码,注:根据自己的java路径而定
export JAVA_HOME=/opt/java

在这里插入图片描述

11.按键ESC 按键:wq 回车保存并退出
12.编辑/opt/hadoop/etc/hadoop/core-site.xml文件,部分截图如下:
vi /opt/hadoop/etc/hadoop/core-site.xml

在这里插入图片描述

13. 按键 :set nu 回车设置行号

在这里插入图片描述

14.按键19gg定位到19行,按键o添加如下代码,部分截图如下
<property>
<name>fs.defaultFS</name>
<value>hdfs://master</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/tmp</value>
</property>

在这里插入图片描述

15.按键Esc,按键:wq保存退出
16.编辑/opt/hadoop/etc/hadoop/hdfs-site.xml文件,部分截图如下
vi /opt/hadoop/etc/hadoop/hdfs-site.xml

在这里插入图片描述

17. 按键 :set nu 回车设置行号

在这里插入图片描述

18.按键20gg定位到20行,按键i添加如下代码
<property>
<name>dfs.replication</name>
<value>3</value>
</property>

在这里插入图片描述

19.按键Esc,按键:wq保存退出
20.复制/opt/hadoop/etc/hadoop/mapred-site.xml.tmplate 名为mapred-site.xml
cp /opt/hadoop/etc/hadoop/mapred-site.xml.template /opt/hadoop/etc/hadoop/mapred-site.xml

在这里插入图片描述

21.编辑/opt/hadoop/etc/hadoop/mapred-site.xml文件,部分截图如下
vi /opt/hadoop/etc/hadoop/mapred-site.xml

在这里插入图片描述

22.按键:set nu回车,设置行号

在这里插入图片描述

23.按键20gg定位到20行,按键i添加如下代码
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

在这里插入图片描述

24.按键Esc,按键:wq保存退出
25.编辑/opt/hadoop/etc/hadoop/yarn-site.xml文件,部分截图如下:
vi /opt/hadoop/etc/hadoop/yarn-site.xml

在这里插入图片描述

26.按键:set nu回车,设置行号

在这里插入图片描述

27.按键18gg定位到18行,按键i添加如下代码,部分截图如下
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

在这里插入图片描述

28.按键Esc,按键:wq保存退出
29.编辑/opt/hadoop/etc/hadoop/slaves文件
vim /opt/hadoop/etc/hadoop/slaves

在这里插入图片描述

30.按键dd删除首行,按键i添加如下内容
master

在这里插入图片描述

31.按键Esc,按键:wq保存退出
32.切换到机器上,命令行中执行如下指令,格式化hdfs,部分截图如下
hdfs namenode -format

在这里插入图片描述

33.机器命令行中执行如下指令,启动集群,启动过程中出现“are you sure you want to continue connecting”,输入yes。
start-all.sh

在这里插入图片描述

34.机器命令行中执行如下指令,查看进程
jps

在这里插入图片描述

35.如上图所示,所有配置完成,进程启动完毕
ps:连续三晚5000+字教程不易,如果对正在看的小伙伴们有帮助恳请留下一赞~
  • 17
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
Hadoop是一个分布式计算框架,可以运行在一个计算机集群上。在开发和测试过程中,我们可以使用分布式来模拟分布式环境。以下是Hadoop分布式安装的步骤: 1. 安装Java环境:Hadoop运行需要Java环境,可以从官方网站下载并安装Java。 2. 下载并解压Hadoop:从官方网站下载Hadoop,并将其解压到本地目录。 3. 配置Hadoop环境变量:设置Hadoop的环境变量,包括JAVA_HOME、HADOOP_HOME、PATH等。 4. 配置hdfs-site.xml:在Hadoop的conf目录下创建hdfs-site.xml文件,并添加以下内容: ``` <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop_store/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop_store/hdfs/datanode</value> </property> </configuration> ``` 其中,dfs.replication指定了数据副本数,dfs.namenode.name.dir和dfs.datanode.data.dir指定了HDFS的数据存储位置。 5. 配置mapred-site.xml:在Hadoop的conf目录下创建mapred-site.xml文件,并添加以下内容: ``` <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` 其中,mapreduce.framework.name指定了MapReduce框架的运行方式,这里指定为yarn。 6. 配置yarn-site.xml:在Hadoop的conf目录下创建yarn-site.xml文件,并添加以下内容: ``` <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration> ``` 其中,yarn.nodemanager.aux-services和yarn.nodemanager.aux-services.mapreduce.shuffle.class指定了YARN的服务和ShuffleHandler的类名。 7. 启动Hadoop:在终端中输入以下命令启动Hadoop: ``` $ start-dfs.sh $ start-yarn.sh ``` 8. 验证Hadoop是否启动成功:在浏览器中访问http://localhost:50070/,可以看到Hadoop的Web界面。在终端中输入以下命令验证Hadoop是否正常工作: ``` $ hadoop fs -mkdir /test $ hadoop fs -ls / ``` 如果以上命令都能正常执行,则说明Hadoop已经成功安装并启动。 以上就是Hadoop分布式安装的步骤,希望能对你有所帮助!
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@北惜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值