Hadoopd的体系架构

HDFS架构

 

  • NameNode,元数据,消耗资源
  • DataNode,保存数据
  • Secondary NameNode,定期备份NameNode

YARN架构

 

 

工作流程:

  • client提交任务,像ResourceManager(RM)发出申请,整个集群能干多少事,RM负责
  • RM找到有空的Node Manager(NM), 每个Node Manager分管单个节点上的资源,NM还能干多少事需要给RM汇总
  • NM接洽client, 找来(新建)项目负责人,App Master(AM),AM负责项目跟进,AM为了完成项目需要多少资源需要向RM申请
  • RM从所有NM中找到空闲资源交给该AM管理
  • 需要注意,一个NM下的任务是多个的,所以有多个AM,同时,每个AM得到的资源可以来自多个NM

 

MR的架构

 

其实这个只是一种计算思想,切分任务map,合并reduce

大数据生态体系

 

 

基于hadoop发展出来的生态体系。

  • 不同数据被不同方式的系统处理
  • 由YARN调度资源
  • 任务处理分为离线和实时,同时也是不同框架负责
  • 数据计算之上就是任务调度以及顶层的业务层面
  • 所有框架之间的协调者,zookeeper
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值