3-2 wordcount执行流程 wordcount流程

本文详细介绍了MapReduce的执行过程,以WordCount为例,从读取文件到Mapper处理,再到Shuffle和Reduce阶段,最后输出结果。重点讨论了Mapper如何将输入转化为(key, value)对,Shuffle阶段的分区、排序和分组,以及Reducer如何计算单词出现次数。通过理解这一流程,可以更好地掌握MapReduce模型的应用。" 119912917,9942725,2021电工初级考试详解与解析,"['电工', '初级考试', '电路', '安全', '培训']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

mapper和reducer输入和输出都是以(key,value)形式的。

在map和reduce之间进行了分组group,按照key2来分组,然后将v2放在一个集合中,作为一个value。

eg:<a,1><a,3>分为a<1,3>

【shuffule非常重要,明天讲】

如果我们想实现mapreduce模型,只需要重写map方法和reduce方法即可,适合各种业务。


奋斗mapreduce执行过程:

map任务: 【记住】

1.读取文件内容,一行内容解析成一个key,value【怎么做的?一会儿介绍】一个(key,value)对执行一次map函数方法

2.在map里实现自己的业务逻辑,转换成新的key,value,然后输出

3.对输入的key,value分区

4.对不同分区的数据,排序分组。</

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值