MapReduce的自定义比较器

最新推荐文章于 2023-03-20 21:58:19 发布

XXuan_

最新推荐文章于 2023-03-20 21:58:19 发布

阅读量452

点赞数

本文链接：https://blog.csdn.net/XXuan_/article/details/105062672

版权

MapReduce在shuffle阶段默认按key值进行分组，但有时我们需要自定义比较规则。本文介绍了如何创建自定义比较器，以实现不同于key相等的分组方式，并提供了相关代码示例。

摘要由CSDN通过智能技术生成

自定义比较器 GroupingComparator 其实就是自己定义MapReduce的比较规则：在Map任务完成后进入shuffle阶段会根据MR默认的比较规则将Map任务输出的key-value值，根据他们key值的不同将相同的key分为一组。这也是为什么Reduce任务中 reduce方法的参数是一个key和一个迭代器的value 。就是根据默认的比较器将key值相等的key-value分为一组。

而有时候我们想要自己定义一个比较器而不是用默认的根据key值是否相等比较 ，我们可以自己定义一个比较器

案例如下：

有如下的订单数据：
1	Pdt_01	222.8
1	Pdt_02	52.8
2	Pdt_03	522.8
2	Pdt_04	122.4
2	Pdt_05	722.4
3	Pdt_06	232.8
3	Pdt_02	33.8

现在要求输出每一个订单中的最贵的商品

代码如下：

package com.jee.groupingcomparator;

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

//订单类
public class Order implements WritableComparable<Order> {

    private String orderId;
    private String orderName;
    private double price;

    public Order(String orderId, String orderName, double price) {
        this

最低0.47元/天解锁文章

XXuan_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MapReduce的自定义比较器

自定义比较器 GroupingComparator 其实就是自己定义MapReduce的比较规则：在Map任务完成后进入shuffle阶段会根据MR默认的比较规则将Map任务输出的key-value值，根据他们key值的不同将相同的key分为一组。这也是为什么Reduce任务中 reduce方法的参数是一个key和一个迭代器的value 。就是根据默认的比较器将key值相等的...
复制链接

扫一扫