Hadoop-MapReduce介绍

目录

MapReduce介绍

MR处理程序的各阶段

Map阶段的执行流程

reduce阶段的执行流程

案例-统计单词个数


MapReduce介绍

Map

将文件中的数据进行切割,组合成键值对,例如统计文件中的单词,可以将每个单词切割出来作为key,1作为值,形成很多<word,1>这样的键值对。即将输入的键值对Map(映射)成其他的键值对。

Reduce

默认进行的操作:先将Map的结果减少(reduce)方便后面的业务处理,将<key,value1>,<key,value2>变为<key,[value1,value2]>形式。之后根据业务要求进行编写代码。

MR处理程序的各阶段

Map阶段的执行流程

  • 阶段一:把输入目录下文件按照一定标准逐个进行逻辑分片,默认一个切片大小为一个块的大小(128M),每个片都由一个MapTask处理。
  • 阶段二:对切片中的数
  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值