MR Mapper/Reducer、Partitioner初解

最新推荐文章于 2022-10-05 21:17:17 发布

shark.zyq

最新推荐文章于 2022-10-05 21:17:17 发布

阅读量783

点赞数

分类专栏： MapReduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yueqian_zhu/article/details/37936847

版权

MapReduce 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Mapper/Reducer：

void map(K1 key, V1 value, OutputCollector<K2, V2> output, Reporter reporter)
throws IOException;

void reduce(K2 key, Iterator<V2> values,OutputCollector<K3, V3> output, Reporter reporter)
throws IOException;

map()为例：

MapReduce框架会通过InputFormat中RecordReader从InputSplit获取一个个Key Value对，并交由map()函数处理。

Partitioner:

作用是对mapper产生的中间结果进行分片，将同一分组的数据交给同一个Reducer处理。第三个参数便是每个mapper的分片数，即Reducer个数。

int getPartition(K2 key, V2 value, int numPartitions);

如何根据Reducer个数对数据进行分组呢？？

HashPartitioner（hadoop默认实现方法）:

public int getPartition(K2 key, V2 value,
int numReduceTasks) {
return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
}

TotalOrderPartitioner（经典）:

用于对数据的全排序中，如果数据量很大，只有一个Reducer会成为作业的瓶颈。方法分析：

1、首先进行数据采样（依赖于好的采样算法），然后将采样进行排序；

2、根据设定的Reduce Task个数N，对排完序的采样数据N等分，确定分割点；

3、将以上的分割点保存到Trie树中，如此一来，就将输入数据分为N等分；

4、由于每个partition有序，对N等分中的局部数据进行排序，即完成了全排序的数据结果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MR Mapper/Reducer、Partitioner初解

Mapper/Reducer：void map(K1 key, V1 value, OutputCollector output, Reporter reporter) throws IOException;
复制链接

扫一扫

专栏目录

shark.zyq CSDN认证博客专家 CSDN认证企业博客

码龄10年

80: 原创

14万+: 周排名

3万+: 总排名

12万+: 访问

: 等级

2042: 积分

42: 粉丝

46: 获赞

8: 评论

32: 收藏

私信

关注

热门文章

分类专栏

最新评论

Leader/Follower 领导者/跟随者线程模型
weixin_41860457: 我是一个初学者，可以麻烦楼主放下实例链接吗？
Spring中的Mybatis基础
九月茅桃回复 shark.zyq: 如果可以配置就好了，可以指定具体的数据源，能配置不同的数据源吗？
Spring中的Mybatis基础
shark.zyq 回复九月茅桃: 可以啊，比较有名的有DBCP,C3P0,Druid。Mybatis3自身也带连接池，指定datasource的type属性为POOLED即可使用。
Spring中的Mybatis基础
九月茅桃: 里面可以配置数据库连接池吗？
SparkSQL 概述
JCJC错别字检测-田春峰: 希望下篇，加一点 SparkSql 在集群上的应用。推荐到首页。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。