Hadoop的部署以及伪分布式的实现

最新推荐文章于 2023-02-28 21:06:04 发布

且听风吟zyw

最新推荐文章于 2023-02-28 21:06:04 发布

阅读量111

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/even160941/article/details/99768638

版权

Hadoop 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

按照官网的说明进行部署
官网说明：http://hadoop.apache.org/docs/r3.0.3/hadoop-project-dist/hadoop-common/SingleCluster.html

实验环境

主机（IP）	功能
server1(172.25.11.1)	name node ，nfs
server2(172.25.11.2)	data node ，nfs
server3(172.25.11.3)	data nod，nfs
真机（172.25.11.250）	浏览器测试

部署过程如下：

server1（nn）

官网获取jdk和hadoop的安装包，出于安全考虑，一般用特定用户来运行hadoop的守护进程，所以我们新建hadoop用户并将安装包移至hadoop用户的家目录下。
解压两个安装包，并做软连接方便我们查看。
将java的二进制可执行命令添加到环境变量中，方便我们后续调用。
修改hadoop-env.sh文件，添加java环境变量。
新建input目录，将所有以.xml结尾的文件拷到input目录下方便后续测试，执行命令：bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.3.jar grep input output 'dfs[a-z.]+'，执行成功后进入output目录下查看结果。

伪分布式的实现

对server1本机进行免密操作，首先要给hadoop用户一个密码。
免密登陆测试。
修改workers目录下为本机ip。
按照官网的说明修改两个配置文件，下图的1表示1份副本。
修改，写入本机的ip以及端口。
格式化namenode节点
格式化成功，在/tmp目录下生成了与hadoop有关的临时文件和目录。
查看开启的进程，有3个下图的进程才表示成功。
开启dfs服务，并通过命令查看此时的节点分配，可以看到此时namenode，datanode，secondarynamenode节点都在本机。
在浏览器中访问本机的9870端口查看详细信息。
日志信息
也可以通过执行report命令查询此时节点的详细信息：
新建目录并上传文件（将input目录下的所有.xml文件上传）。
在浏览器中查询我们上传的文件。
上传成功，且所有文件的副本数都为1，与我们前面在配置文件里的设置一致。
如果我们在浏览器中直接删除文件会报错。
删除input与output目录继续测试。
cat，查看hdfs文件系统中output目录下的内容。
get，将hdfs文件系统中output下载至本地。

且听风吟zyw

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop的部署以及伪分布式的实现

官网：http://hadoop.apache.org/docs/r3.0.3/hadoop-project-dist/hadoop-common/SingleCluster.html
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。