Hadoop伪分布式测试集群搭建总结

最新推荐文章于 2023-01-20 12:20:51 发布

马小胖测试历险记

最新推荐文章于 2023-01-20 12:20:51 发布

阅读量886

点赞数 2

分类专栏： Hadoop 大数据测试文章标签： hadoop 大数据分布式 linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35779794/article/details/111620544

版权

大数据测试同时被 2 个专栏收录

24 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

导语：Hadoop的搭建有三种方式，单机版适合开发调试；伪分布式版，适合模拟集群学习；完全分布式，生产使用的模式。因为我的电脑带不动三个虚拟机，所以没办法搭建三个节点的完全分布式集群，所以本文主要记录Hadoop伪分布式测试集群的搭建过程！

基于centos7+Hadoop2.7.5

一、安装虚拟机，以及配置centos7镜像，基本步骤省略，主要介绍相关网络配置

1、虚拟机编辑网络为以下模式

VMnet8IP地址：192.168.83.2

2、进入虚拟机，ip addr查看分配的ip地址

3、windows主机ping该网络

4、修改主机名为node01

5、修改域名解析映射文件使得后续可以直接通过主机名访问，sudo vi /etc/hosts

6、ping一波，测试是否生效

linux主机的配置已经全部完成，接下啦借助xshell连接至linux，借助winSCP上传文件至Linux环境中

二、安装JDK，配置环境变量

1、上传jdk至/usr/java目录下，如没有创建目录

2、配置环境变量：

3、source使其生效

4、查看jdk是否安装成功

三、安装Hadoop

1、下载hadoop-2.7.5，并上传至以下安装目录：/usr/local

2、配置hadoop-env.sh

3、配置core-site.xml:

vi core-site.xml,在configuration中添加各配置项

配置默认采用的文件系统。----（由于存储层和运算层松耦合，要为它们指定使用hadoop原生的分布式文件系统hdfs。value填入的是uri，参数是 分布式集群中主节点的地址 : 指定端口号)
配置hadoop的公共目录-----（指定hadoop进程运行中产生的数据存放的工作目录，NameNode、DataNode等就在本地工作目录下建子目录存放数据。但事实上在生产系统里，NameNode、DataNode等进程都应单独配置目录，而且配置的应该是磁盘挂载点，以方便挂载更多的磁盘扩展容量）

4、配置 hdfs-site.xml

vi hdfs-site.xml,配置hdfs的副本数---（客户端将文件存到hdfs的时候，会存放在多个副本。value一般指定3，但因为搭建的是伪分布式就只有一台机器，所以只能写1。）

5、配置 mapred-site.xml

vi mapred-site.xml---指定MapReduce程序应该放在哪个资源调度集群上运行。若不指定为yarn，那么MapReduce程序就只会在本地运行而非在整个集群中运行。

6、配置 yarn-site.xml，vi yarn-site.xml

1）指定yarn集群中的老大（就是本机）

2）配置yarn集群中的重节点，指定map产生的中间结果传递给reduce采用的机制是shuffle

7、配置环境变量PATH

8、设置防火墙

9、配置ssh免密登录

1）创建公钥、私钥，输入yes加回车，这里忘输入了，后面也可以输入yes

2）创建authorized_keys文件并修改权限为600

3）将公钥追加到authorized中

4）测试免密登录

四、启动Hadoop

1、初始化hadoop

2、测试是否启动成功

五、从windows环境进入hdfs和yarn集群相对应的web界面

1、HDFS：http://ip:50070

2、YARN：http://ip：8088

马小胖测试历险记

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
Hadoop伪分布式测试集群搭建总结

导语：Hadoop的搭建有三种方式，单机版适合开发调试；伪分布式版，适合模拟集群学习；完全分布式，生产使用的模式。因为我的电脑带不动三个虚拟机，所以没办法搭建三个节点的完全分布式集群，所以本文主要记录Hadoop伪分布式测试集群的搭建过程！基于centos7+Hadoop2.7.5一、安装虚拟机，以及配置centos7镜像，基本步骤省略，主要介绍相关网络配置1、虚拟机编辑网络为以下模式VMnet8IP地址：192.168.83.22、进入虚拟机，ip addr查看分配的ip地址
复制链接

扫一扫

专栏目录

马小胖测试历险记 CSDN认证博客专家 CSDN认证企业博客

码龄8年

70: 原创

31万+: 周排名

72万+: 总排名

5万+: 访问

: 等级

857: 积分

52: 粉丝

49: 获赞

25: 评论

232: 收藏

私信

关注

热门文章

分类专栏

最新评论

Jmeter导入jmx文件报错CannotResolveClassException: kg.apc.jmeter.perfmon.PerfMonCollector 解决办法
m0_72012052: 放到ext目录下还是报一样的错，不是提升install怎么办
一起学Python-Day01-练习题
dadachun: 第2道题答案找到了，import math for i in range(10000): # 转化为整型值 x = int(math.sqrt(i + 100)) y = int(math.sqrt(i + 268)) if(x * x == i + 100) and (y * y == i + 268): # 如果一个数的平方根的平方等于该数，这说明此数是完全平方数 print(i)
Python自动化测试----Python基础知识掌握
vegetable_plus: # 6、切片：能够输出从特定位置到列表末尾的所有元素，根据索引 number_list=['one','two','three','four'] print(number_list [-2:]) # 运行结果：['three','four'] number_list=['one','two','three','four'] new_list=number_list[:] print(new_list) """ ['one', 'two', 'three', 'four'] """ number_list=['one','two','three'] print(new_list) """ ['one', 'two', 'three', 'four'] 这说明new_list变量的地址值不同""" 您好大佬，第六的不能复现，是python版本问题，还是我测试代码有问题。
Python自动化测试----Python基础知识掌握
m0_67210871: 你好我想问一下我的电脑不知道为什么下载不了Excel的函数为什么呢
Jmeter导入jmx文件报错CannotResolveClassException: kg.apc.jmeter.perfmon.PerfMonCollector 解决办法
hendtbao: 还真解决了，谢谢楼主

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。