大数据(Hadoop)-MapReduce

MapReduce计算模型是大数据处理模式的鼻祖,这种模型很容易实现数据处理对并行化,并且编程模型简单,但对于复杂的运算逻辑往往需要大量的代码。

MapReduce任务涉及到的组件

在hadoop1.x中,MapReduce的运行依赖于JobTracker和TaskTracker,但在最新的hadoop版本中,以及被yarn替代,涉及到的主要组件有:
1)ResourceManager:负责整集群的资源管理和任务分配
2)NodeManager:负责单个节点的资源管理及执行任务
3)ApplicationMaster:负责当前Job的资源申请,任务调度以及错误处理等
4)Container:Yarn中资源的抽象,Task运行在Container所规则的资源边界内

MapReduce的运行模式

本地模式

本地模式是运行在程序员电脑上,以多线程的方式模拟MapReducer过程,适合本地调试

Yarn-Client

MapTask和ReduceTask运行在集群的NodeManager节点上,但ApplicationMaster运行在客户端,这种模式能够更好但观察到Job的运行情况

Yarn-Cluster

这种方式是将Task和ApplicationMaster都运行在NodeManager的Container上,好处是客户端可以快速返回,不用阻塞等待计算结果。但由于ApplicationMaster由ResourceManager分配

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值