Linux下搭建Hadoop分布式教程

最新推荐文章于 2024-08-15 14:57:09 发布

数据库农民工

最新推荐文章于 2024-08-15 14:57:09 发布

阅读量2k

点赞数 1

分类专栏： Hadoop 文章标签： Linux Hadoop 伪分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37823979/article/details/103083897

版权

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1、首先在Linux中安装jdk与Hadoop，解压及安装成功后配置环境变量。

vi /etc/profile

打开文件后，将下面这段代码复制进去

#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_231
export PATH=$PATH:$JAVA_HOME/bin
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

一段是jdk的环境变量，还有一段是Hadoop的环境变量。

配置好后，可以通过javac与java -version命令去检查jdk的环境变量是否配置成功。

Hadoop可以通过输入start -d 当使用tab补全的时候出现 start-dfs.sh即配置成功。

检查防火墙是否关闭：systemctl status firewalld

进入到 /opt/module/hadoop-2.7.3/etc/hadoop目录中，里面有很多配置文件，这里需要配置的文件有四个

（1）core-site.xml

<property>
<name>fs.defaultFS</name>
<value>hdfs://bigdata1:9000</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/opt/module/hadoop-2.7.3/data</value>
</property>

将文件复制进配置文件中的如下位置，bigdata1为主机名称。

（2）hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

<property>
<name>dfs.namenode.secondary.http-address</name>
<value>bigdata1:50090</value>
</property>

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

（3）yarn-site.xml

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<property>
<name>yarn.resourcemanager.hostname </name>
<value>bigdata1</value>
</property>

<property>
<name>yarn.log-aggregation-enable </name>
<value>true</value>
</property>

<property>
<name>yarn.log-aggregation.retain-seconds </name>
<value>604800</value>
</property>

(4) mapred-site.xml

首先 cp mapred-site.xml.template mapred-site.xml

因为文件夹中只有mapred-site.xml.template 这个文件所以要把这个文件改名为 mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>bigdata1:10020</value>
</property>

<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>bigdata1:19888</value>
</property>

上面几步完成后需要将jdk的环境变量（export JAVA_HOME=/opt/module/jdk1.8.0_231）

复制出来加入到下面几个文件中，都是直接放在文件的最后一行

hadoop-env.sh

yarn-env.sh

mapred-env.sh

最后一步，打开 slaves 这个文件，将里面的localhost改为你的主机的名称。

之后对所配置的文件进行格式化 hdfs namenode -format

格式化之后进行启动 start-all.sh

此时当他要你输入密码的时候就将你的密码输入进去，

当启动成功之后，在浏览器里面输入你的主机IP:50070 查看是否可以访问成功

当出现如下页面的时候即已成功，到此伪分布式算是搭建成功。

数据库农民工

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。