mapreduce分组统计_hadoop MapReduce编写一个分组统计并排序查询-分组

最新推荐文章于 2024-03-31 10:01:31 发布

weixin_39721807

最新推荐文章于 2024-03-31 10:01:31 发布

阅读量335

点赞数

文章标签： mapreduce分组统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39721807/article/details/111786324

版权

本文介绍了如何使用Hadoop MapReduce处理销售统计表数据，实现按销售员分组并按销售额降序排序的功能。通过创建一个名为GroupCount的类，包含Map和Reduce阶段，Map阶段筛选5月份数据并按销售员分组，Reduce阶段进行销售额统计并输出。最终在本地运行MapReduce作业，展示分组统计结果。

摘要由CSDN通过智能技术生成

说一下需求，有一张销售统计表，记录每个销售员每天的销售情况，现在要统计出某一月的每个销售员的销售情况并且按照销售额从高往低排序(hadoop默认是升序)。

首先在mysql里创建一张表

CREATE TABLE `t_product_sales` (

`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',

`area` varchar(255) DEFAULT NULL COMMENT '地区',

`salesman` varchar(255) DEFAULT NULL COMMENT '销售员姓名',

`sales_money` decimal(10,0) DEFAULT NULL COMMENT '销售额',

`sale_time` varchar(255) DEFAULT NULL COMMENT '销售日期(年-月-日)',

PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT=11717 DEFAULT CHARSET=utf8 COMMENT='销售统计表';

然后使用excl造数据，为了节约时间，这里制造了5月份的所有数据表数据

下面是在mysql里需求的sql语句

SELECT salesman,sum(sales_money) totalmoney

FROM `t_product_sales`

WHERE sale_time like '2015-05%'

GROUP BY salesman

ORDER BY totalmoney DESC;

将数据从mysql中导出，并且导出成文本，文本数据，将导出的文本上传到hdfs中，放在根据经下的groupcount-in文件夹下。

我们先来分析下数据，在文本里每一行代表一个记录，在一行中以制表符区分字段。我们首先要取出所有五月份的数据，然后再对每一天的数据进行操作，取出每个人的销售额，最后排序。那么具体到程序上，map的任务就是取出五月份的的数据，reduce就是进行统计。好了，下面开始编写。

在Eclipse创建项目，编写一个GroupCount类，下面是类代码：

GroupCount.java此类将数据提取出来，然后按销售员分组输出

package gruopcount;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.DoubleWritable;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.WritableComparable;

import org.apach

最低0.47元/天解锁文章

weixin_39721807

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
mapreduce分组统计_hadoop MapReduce编写一个分组统计并排序查询-分组

说一下需求，有一张销售统计表，记录每个销售员每天的销售情况，现在要统计出某一月的每个销售员的销售情况并且按照销售额从高往低排序(hadoop默认是升序)。首先在mysql里创建一张表CREATETABLE`t_product_sales`(`id`int(11)NOTNULLAUTO_INCREMENTCOMMENT'主键',`area`varchar(255)DEFAULT...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。