MapReduce原理入门介绍

MapReduce

  • 介绍:
    • MapReduce是一个分布式运算程序的编程框架, 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序, 并发运行在Hadoop集群上
    • MapReduce设计并提供了统一的计算框架,为程序员隐藏了绝大多数系统层面的处理细节。
      为程序员提供一一个抽象和高层的编程接口和框架。程序员仅需要关心其应用层的具体计算问题,仅需编写少量的处理应用本身计算问题的程序代码。如何具体完成这个并行计算任务所相关的诸多系统层细节被隐藏起来,交给计算框架去处理
  • 核心思想:分而治之

    • Map负责“分”, 即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的
      前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。
    • Reduce负责“合”, 即对map阶段的结果进行全局汇总。
    • MapReduce运行在yarn集群
  • 执行流程:

Client ApplicationManager ResourceSheduler NodeManager MRAppMastr NodeManager2 提交计算任务(1) ResourceManager 启动AppMastr(2) 启动(3) 向ResourceManager申请资源(4) 回复相应的资源列表(5) 要求nm分配资源(6) 启动相应的Map Task和Reduce Task(7) 返回计算状态和结果(8) 汇报计算结果(9) Client ApplicationManager ResourceSheduler NodeManager MRAppMastr NodeManager2 执行流程
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值