Hadoop架构模型

1.hadoop 1.x架构模型:
分布式文件存储系统:HDFS
NameNode(主节点:管理元数据)
secondaryNameNode(作用是合并元数据信息,辅助NameNode管理元数据信息)
DataNode DataNode DataNode(存储数据)
分布式数据计算系统:MapReduce
JobTracker(主节点:负责分配任务)
TaskTracker TaskTracker TaskTracker(负责执行任务)
注:元数据:描述数据的数据。
缺点:单节点故障。

2.hadoop2.x架构模型:
(1)文件存储和数据计算单节点:
分布式文件存储系统:HDFS
NameNode
SecondaryNameNode
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ResourceManager(主节点:接收用户的任务请求,分配资源给NodeManager)
NodeManager NodeManager NodeManager(执行任务)
ApplicationManager进程:每一个任务请求,ResourceManager都会在某个NodeManager上启动一个APPmaster进程,该APPmaster进程负责向ResourceManager申请资源,并分配任务给每个NodeManager

(2)文件存储高可用,数据计算单节点:略;
(3)文件存储单节点,数据计算高可用:略;
(4)文件存储和数据计算高可用:
分布式文件存储系统:HDFS
JournalNode JournalNode JournalNode(文件系统元数据信息管理,一般都是奇数个)
ZK
NameNode(active状态) NameNode(从节点,standby状态,主要负责监控active何时挂掉,一旦挂掉,立刻接管其工作)
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ZK
ResourceManager(主节点) ResourceManager(备份节点)
NodeManager NodeManager NodeManager
注:(1)如果NameNode高可用,就没有SecondaryNameNode,取而代之的是JournalNode,其主要用于同步元数据信息,保证2个NameNode的元数据信息一致,并且JournalNode需要奇数个,半数及以上的JournalNode写入元数据成功,就代表写入成功。
(2)两个NameNode组成主备的架构。
(3)集群的脑裂:为了避免集群的脑裂,造成看到的数据不一样,一定要保证两个NameNode中的元数据信息一模一样,而JournalNode就是同步两个NameNode中的元数据信息,保证两者相同。
(4)NameNode高可用的自动切换,主要是通过两个守护进程ZKFC来实现。

转载于:https://www.cnblogs.com/mediocreWorld/p/10940317.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值