Hadoop之MapReduce-Partition编程

最新推荐文章于 2023-10-28 09:36:52 发布

VIP文章 crazy_gai

最新推荐文章于 2023-10-28 09:36:52 发布

阅读量669

点赞数

分类专栏： # 大数据组件文章标签： Partition编程 Partition MapReduce

本文链接：https://blog.csdn.net/gaijianwei/article/details/46011353

版权

一、问题描述

在Hadoop序列化案例（http://blog.csdn.net/gaijianwei/article/details/46004025）的基础上，将输出的数据按照手机号所属的运营商进行分区。

二、问题实现

DataCount代码（只是对Hadoop序列化案例的DataCount代码稍作修改）

package edu.jianwei.hadoop.mr;

import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import org.apache.commons.collections.map.HashedMap;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Mapper.Context;
import org.apache.hadoop.mapreduce.Partitioner;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import

最低0.47元/天解锁文章

优惠劵

crazy_gai

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop之MapReduce-Partition编程

一、问题描述在Hadoop序列化案例（http://blog.csdn.net/gaijianwei/article/details/46004025）的基础上，将输出的数据按照手机号所属的运营商进行分区。二、问题实现 DataCount代码（只是对Hadoop序列化案例的DataCount代码稍作修改）package edu.jianwei.hadoop
复制链接

扫一扫