Hadoop伪分布式部署（Linux）

最新推荐文章于 2024-05-23 20:15:07 发布

派dark星丶

最新推荐文章于 2024-05-23 20:15:07 发布

阅读量274

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/m0_53097788/article/details/119715248

版权

Hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Hadoop的架构和组成

*
Hadoop分布式系统基础框架具有创造性和极大的扩展性，用户可以在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的高速运算和存储。
Hadoop的核心组成部分是HDFS，MapReduce以及Common，其中HDFS提供了海量数据的存储，MapReduce提供了对数据的计算，Common为其他模块提供了一系列文件系统和通用文件包。
*

部署前需要配置Java环境（已经配置可以跳过）

1.解压jdk

tar -zxvf jdk-8u121-linux-x64.tar.gz

2.配置环境变量

vim /etc/profile

然后添加：（根据自己的jdk版本进行调整）
在这里插入图片描述
使配置生效：

source /etc/profile

3.检查是否配置成功

java -version

在这里插入图片描述

Hadoop安装配置

我这里使用的版本是2.7.2

1.解压Hadoop

在这里插入图片描述

2.配置Hadoop

在 /etc/profile文件中添加：
在这里插入图片描述

配置使其生效

source /etc/profile

检验是否成功（在终端输入hadoop）
在这里插入图片描述

3.分别配置并修改以下文件：

1）在第二十五行修改代码
**vim **
在这里插入图片描述

2）
在这里插入图片描述

3）

4）

修改完后将其重命名：
在这里插入图片描述
5）

4.生成秘钥，使得ssh服务免密连接localhost

格式化，终端输入：

1| hdfs namenode -format

在这里插入图片描述
启动，终端输入（一路输入yes）：

2| start-all.sh

在这里插入图片描述
启动完成后，检查集群：

jps

在这里插入图片描述
Web控制台访问：http://192.168.27.133:50070、http://192.168.27.133:8088
上传HDFS

hdfs dfs -put in.txt /adir 上传本地路径下的in.txt文件到hdfs的/adir目录下

运行wordcount：

hadoop jar /home/lingan/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /data/wordcount /output/wordcount

然后在http://192.168.27.133:50070中查看/usr/root/output/part-r-00000文件里的词频统计结果。

派dark星丶

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hadoop伪分布式部署（Linux）

Hadoop的架构和组成部署前需要配置Java环境（已经配置可以跳过）Hadoop安装配置1.解压Hadoop2.配置Hadoop3.分别配置并修改以下文件：4.生成秘钥，使得ssh服务免密连接localhost*Hadoop分布式系统基础框架具有创造性和极大的扩展性，用户可以在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的高速运算和存储。Hadoop的核心组成部分是HDFS，MapReduce以及Common，其中HDFS提供了海量数据的存储，MapReduce提供了对数据的计算，Co
复制链接

扫一扫

专栏目录