用一个MapReduce输出多个key的分区文件

本文介绍了一个MapReduce任务,该任务处理包含主叫号码、被叫号码、通话时间和通话时长的数据,根据通话日期的年、月、日进行分区,统计通话时长和次数。代码实现中忽略了被叫号码的通话时长,只针对主叫号码进行统计,最终生成了按日、按年、按月三个分区文件。
摘要由CSDN通过智能技术生成

先看一下要处理的数据类型

19392963501,17816115082,2018-09-18 16:19:44,1431
14081946321,13094566759,2018-05-23 09:34:27,0610
13415701165,18939575060,2018-11-23 21:33:23,1031
15590483587,16303009156,2018-08-02 07:38:00,0487
15539613975,17882324598,2018-10-19 09:08:15,0948
数据字段分别为主叫号码,被叫号码,通话时间,通话时长
我们的需求是:将数据按号码的通话日期的年,月,日分别计算时长和次数,用一个MapReduce实现,在这里我处理的时候是忽略被叫号码的通话时长,仅以主叫号码为例。

代码部分

package mapReducePhone;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Partitioner;
import org.apache.hadoop.mapreduce.Reducer;
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值