Hadoop1.x与Hadoop2.x的区别

hadoop1.x的架构模型:

 

hdfs部分:典型的主从架构,没有主备的概念

    namenode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求,处理用户的请求

    secondaryNamenode:主要是辅助namenode管理元数据信息的

    datanode集群当中的从节点,主要用于存储数据

文件系统:

    分盘 文件夹  文件名称   创建时间,创建人,修改时间  文件大小,文件名称,文件路径,文件权限  这些信息,全部都是描述性的信息

mapReduce分布式文件计算系统:

    jobTracker:主节点,接收用户请求,分配任务给taskTracker去执行

    taskTracker:从节点,主要用于接收jobTracker分配的任务

 

hadoop2.x当中的架构模型:


hdfs文件系统:
    namenode:集群当中的主节点,主要用于维护元数据信息,以及处理用户的请求
    secondaryNamenode:主要是辅助namenode管理元数据信息的(如果namenode是高可用,那么就没有secondaryNamenode了,多了journalnode,并且journalnode最好是奇数个)
    datanode:集群当中的从节点,主要用于存储数据

yarn资源调度系统:
    resourceManager:yarn资源调度系统的主节点,接收用户请求,分配资源(分配CPU ,分配内存等等)
    nodeManager:从节点,主要用于处理计算任务


namenode高可用:
    namenode active状态:处于活跃的主节点,处理用户请求,维护元数据信息
    namenode stand 状态:处于备份的节点,活跃的主节点死了之后,备份的节点,马上切换为活跃的主节点,对外提供服务
    如果namenode高可用,那么一定要保证namenode的元数据信息同步一致,如果不一致,就会出现脑裂的问题
    journalNode:为了解决元数据共享的问题,引入journalNode的机制,专门用于同步元数据信息
    zkfc:zkFailoverController ,amenode的守护进程,主要用于监听namenode什么时候死掉,死掉了之后,马上通知另外一个namenode切换为主节点
    

namenode与resourceManager的高可用:
    hadoop 2.0版本引入namenode高可用机制
    resourcemanager  2.4.0版本引用高可用机制
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值