MapReduce编程小案例.5th—分组topn的简单实现

最新推荐文章于 2024-07-21 02:58:52 发布

RobertDowneyLm

最新推荐文章于 2024-07-21 02:58:52 发布

阅读量2.9k

点赞数

分类专栏：学习笔记干货教程文章标签： MapReduce 大数据

本文链接：https://blog.csdn.net/RobertDowneyLm/article/details/80327333

版权

本文介绍了一个MapReduce编程案例，旨在展示如何在大数据场景下实现按orderID分组并获取每个组内花费最高的前三项数据。通过定义OrderBean类并覆盖比较方法，以及在MapReduce类中使用Collections.sort()进行排序来达成目标。

摘要由CSDN通过智能技术生成

MapReduce编程小案例.5th—分组topn的简单实现

需求：有如下一组数据：

order001,u001,小米6,1999.9,2
order001,u001,雀巢咖啡,99.0,2
order001,u001,安慕希,250.0,2
order001,u001,经典红双喜,200.0,4
order001,u001,防水电脑包,400.0,2
order002,u002,小米手环,199.0,3
order002,u002,榴莲,15.0,10
order002,u002,苹果,4.5,20
order002,u002,肥皂,10.0,40
order003,u001,小米6,1999.9,2
order003,u001,雀巢咖啡,99.0,2
order003,u001,安慕希,250.0,2
order003,u001,经典红双喜,200.0,4
order003,u001,防水电脑包,400.0,2

需要得到如下数据：

order001,u001,小米6,1999.9,2,3999.8
order001,u001,防水电脑包,400.0,2,800.0
order001,u001,经典红双喜,200.0,4,800.0
order003,u001,小米6,1999.9,2,3999.8
order003,u001,经典红双喜,200.0,4,800.0
order003,u001,防水电脑包,400.0,2,800.0
order002,u002,小米手环,199.0,3,597.0
order002,u002,肥皂,10.0,40,400.0
order002,u002,榴莲,15.0,10,150.0

把同一个orderID的数据分组，并且列出前三项花费最多的数据行

实现代码如下：

写一个OrderBean类，并且覆写比较的方法，先比较总价格，再比较ID：

package cn.edu360.mr.order.topn;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.io.Serializable;

最低0.47元/天解锁文章

RobertDowneyLm

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录