Hadoop教程(五)Hadoop分布式集群部署安装

本文详细介绍了如何部署Hadoop分布式集群,包括集群规划、软件下载、配置hosts文件、设置ssh免密码登录、关闭防火墙、上传软件、修改配置文件、配置Zookeeper集群、启动Zookeeper和JournalNode,以及最终启动HDFS和YARN,并验证了HDFS的HA主备切换功能。
摘要由CSDN通过智能技术生成

 

 

Hadoop教程()Hadoop分布式集群部署安装

 

 

1 Hadoop分布式集群部署安装

hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步activenamenode的状态,以便能够在它失败时快速进行切换。

   hadoop2.0官方提供了两种HDFS HA的解决方案,一种是NFS,另一种是QJM。这里我们使用简单的QJM。在该方案中,主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode

  这里还配置了一个zookeeper集群,用于ZKFCDFSZKFailoverController)故障转移,当ActiveNameNode挂掉了,会自动切换Standby NameNodestandby状态。



1.1 Hadoop分布式集群工作原理图

1.2 集群规划

主机名

IP

安装软件

运行进程

Hadoop1

192.168.1.121

JdkHadoop

NameNodeDFSZKFailoverController

Hadoop2

192.168.1.122

JdkHadoop

NameNodeDFSZKFailoverController

Hadoop3

192.168.1.123

JdkHadoop

ResourceManager

Hadoop4

192.168.1.124

JdkHadoopZookeep

DataNodeNodeManagerJournalNodeQuorumPeerMain

Hadoop5

192.168.1.125

JdkHadoopZookeep

DataNodeNodeManagerJournalNodeQuorumPeerMain

Hadoop6

192.168.1.126

JdkHadoopZookeep

DataNodeNodeManagerJournalNodeQuorumPeerMain

 

1.3 相关下载

1、JDK下载地址:jdk-8u66-linux-x64.tar.gz

Linux安装JDK及环境变量配置,参见:http://blog.csdn.net/yuan_xw/article/details/49948285

 

2、Hadoop下载:hadoop-2.7.1.tar.gz

 

3、Zookeeper下载:zookeeper-3.4.5.tar.gz


1.4 配置hosts文件

配置Hadoop1服务器,执行命令:vi /etc/hosts

127.0.0.1    localhost

192.168.1.121   Hadoop1

192.168.1.122   Hadoo

  • 8
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值