Hadoop 分布式集群搭建

最新推荐文章于 2022-12-24 01:10:13 发布

weixin_44940132

最新推荐文章于 2022-12-24 01:10:13 发布

阅读量1.1k

点赞数

分类专栏： hadoop学习笔记文章标签： hadoop

本文链接：https://blog.csdn.net/weixin_44940132/article/details/124541394

版权

hadoop学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hadoop 分布式集群搭建

搭建环境 vmware15，
系统Centos7，
hadoop2.7.1，java1.8

节点分布图
在这里插入图片描述

解压hadoop文件：
在 opt/ 文件下新建一个 softwares/ 文件夹（用于存放压缩包）

#tar -zxvf 文件名

在这里插入图片描述

配置系统环境文件
修改文件 vim /etc/profile
在末尾添加环境变量

使文件生效：source /etc/profile

测试一下：
在这里插入图片描述

可以看到版本号就说明系统环境配置完成了。

配置hadoop环境变量
进入 etc/hadoop/ 文件夹下，hadoop基本上所有的文件都是在这里配置
配置HDFS

修改文件vim hadoop.env.sh
添加 JAVA_HOME 环境路径

2）修改文件vim core-site.xml 写入信息
在这里插入图片描述

fs.defaultFS：HDFS的默认访问路径，也是NameNode的访问地址。

hadoop.tmp.dir：Hadoop数据文件的存放目录。该参数如果不配置，默认指向/tmp目录，而/tmp目录在系统重启后会自动被清空，从而导致Hadoop的文件系统数据丢失。

（3）修改 vim hdfs-site.xml 添加信息
在这里插入图片描述

dfs.replication：文件在HDFS系统中的副本数。

配置 vim slaves 文件添加节点名

在这里插入图片描述

配置yarn环境
（1）修改文件前，先修改文件名在修改内容

（2）修改 vim yarn-site.xml 文件添加

在这里插入图片描述

yarn.nodemanager.aux-services：NodeManager上运行的附属服务，需配置成mapreduce_shuffle才可运行MapReduce程序。YARN提供了该配置项用于在NodeManager上扩展自定义服务，MapReduce的Shuffle功能正是一种扩展服务。

复制
配置好上面的所有文件后，分别将文件夹发送到各个节点上
使用 scp -r 将文件分发
格式化namenode
在hadoop100 执行命令：
#hadoop namenode -format

在这里插入图片描述

出现如上信息就说明格式化成功了
注意：格式化切记不能多次使用，如果第一次没有成功，先试着检查配置文件有哪一步错了。
在这里插入图片描述

8.启动hadoop
在这里插入图片描述

查看各个节点：jps
在这里插入图片描述

测试HDFS 进入http:// ip：50070

出现这个界面，且有自己的主机名就说明成功了

测试：单词统计
1.在 opt/ 目录下创建新文件夹text/，写一个mp.txt文件，在里面添加内容

在这里插入图片描述

2.在hdfs集群上，创建文件夹

#hdfs dfs -mkdir /input

在这里插入图片描述

3.将文件上传到hdfs集群上

#hadoop fs -put /opt/test/mp.txt /input

` 在这里插入图片描述

可以通过50070 访问，也可以用密令查看文件
在这里插入图片描述

以 input 作为输入目录，output 目录作为输出目录
hadoop 中自带所依赖包都存放在 share/hadoop/mapreduce/ 目录下

5.执mapreduce 进行单词统计
在这里插入图片描述

查看文件夹，生成两个文件
_SUCCESS文件为执行状态文件
part-r-00000文件则为存储实际的执行结果
在这里插入图片描述

这样实验就完成了。

如果有出现文件不能下发节点的，就说明没有配置好集群节点。可以看另一篇关于集群节点配置
码字不易，请好好珍惜投个小赞，

weixin_44940132

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 分布式集群搭建

Hadoop 分布式集群搭建搭建环境 vmware15，系统Centos7，hadoop2.7.1，java1.8节点分布图解压hadoop文件：在 opt/ 文件下新建一个 softwares/ 文件夹（用于存放压缩包）#tar -zxvf 文件名配置系统环境文件修改文件 vim /etc/profile在末尾添加环境变量使文件生效：source /etc/profile测试一下：可以看到版本号就说明系统环境配置完成了。配置hadoop环境变量进入 e
复制链接

扫一扫

专栏目录