三台云主机搭建hadoop集群

最新推荐文章于 2024-07-14 17:13:48 发布

niagijg

最新推荐文章于 2024-07-14 17:13:48 发布

阅读量999

点赞数 1

分类专栏： hadoop 文章标签： hadoop 云主机集群搭建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niagijg/article/details/85250860

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、硬件环境准备——云主机（三台）

分别为（配置均为1核2GB 40GB高速云盘）：

阿里云：IP:47.107.xx.xxx

华为云：ip:114.116.xx.xxx

腾讯云：ip:134.175.xxx.xx

三台主机均为centos7.3-x64系统，由于制作测试用，默认已经关闭系统防火墙。

三台主机之间通过公网IP访问，之间分别设置了ssh免密登录

三台主机修改hostname 分别任 master slave1 slave2 顺序与以上对应

修改hosts 添加 master slave1 slave2对应的IP绑定

（注意点：由于公网ip是云服务器厂商映射出来的所以在服务器的网卡里面查不到这个地址，正确的做法是在hosts里面做映射的时候自己服务器的ip设置网卡中的IP地址，其他机器设为公网IP地址，否则自己服务器监听端口的时候无法对应到具体的端口）

软件环境

Hadoop2.8.4软件包----->安装目录统一为/usr/share/opt/bigdata/hadoop

基于yarn资源模型的配置

三台机器节点规划

	master	Slave1	Slave2
HDFS	Namenode DataNode	secondaryManager DataNode	DataNode
YARN	Nodemanager	Nodemanager	RecourceManager Nodemanager
Histrory	HistroryServer

配置文件如下：hadoop.env.sh yarn.env.sh mapred.env.sh

分别配置JAVA_HOME路径

Hadoop-site.xml------>hadoop核心配置文件

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/share/opt/bigdata/hadoop/hadoop-2.8.4/tmp/data</value>

</property>

</configuration>

HDFS端口为9000

Hdfs-site.xml

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>slave1:50090</value>

</property>

<property>

<name>dfs.namenode.http-address</name>

<value>master:50070</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

</configuration>

Mapred-site.xml

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

</configuration>

yarn-site.xml

<configuration>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>slave2</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>86400</value>

</property>

</configuration>

以上为最基本配置文件

关于端口开放

关于集群各个端口详情参考这个https://www.cnblogs.com/liying123/p/7097806.html

4、启动集群/hadoop2.8.4/sbin/start-all.sh

(注意一点测试过程中出现一些小问题使用以上脚本启动集群后RecourceManager可能无法启动，可以先用stop-yarn.sh关闭yarn集群然后到，部署RecourceManager的主机上面执行start-yarn.sh，此时使用jps查看集群状态为正常状态)

使用自带wordcount测试集群

后续。。。。。。。。。。。。。。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。