WordCount词频统计

最新推荐文章于 2023-12-27 17:10:23 发布

斑马在忙

最新推荐文章于 2023-12-27 17:10:23 发布

阅读量3.6k

点赞数 1

分类专栏：杂七杂八文章标签： mapreduce hadoop apache

本文链接：https://blog.csdn.net/qq_45065956/article/details/122489225

版权

@WordCount词频统计详解（乱序版）

WordCount主要分三部分：
WordCountMain、WordCountMapper、WordcountReducer

WordCountMain: 用来统筹map逻辑以及reducer逻辑

WordCountMapper：
切分，编写map逻辑使得<k1,v1>转换成<k2,v2>

WordcountReducer：

编写reducer逻辑使得<k2,v2>转换成<k3,v3>

WordCountMain

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

   //将map与reducer组织在一起
public class WordCountMain extends Configured implements Tool {

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

斑马在忙

关注关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
WordCount词频统计

@WordCount词频统计详解WordCount主要分三部分：WordCountMain、WordCountMapper、WordcountReducerWordCountMain: 用来统筹map逻辑以及reducer逻辑WordCountMapper：切分，编写map逻辑使得<k1,v1>转换成<k2,v2>WordcountReducer：编写reducer逻辑使得<k2,v2>转换成<k3,v3>WordCountMain
复制链接

扫一扫