分组发生在reducetask阶段,分组是针对同一个区的数据进行分组。分组的目的是为了让不同组的数据进入reduce进行处理。
分区发生在maptask阶段,分区的目的是为了让数据进入哪个reducetask。
一句话搞懂hadoop分区分组的不同
最新推荐文章于 2022-07-23 22:38:09 发布
分组发生在reducetask阶段,分组是针对同一个区的数据进行分组。分组的目的是为了让不同组的数据进入reduce进行处理。
分区发生在maptask阶段,分区的目的是为了让数据进入哪个reducetask。