WordCount2

最新推荐文章于 2021-06-06 14:11:38 发布

on_way_

最新推荐文章于 2021-06-06 14:11:38 发布

阅读量1k

点赞数

分类专栏： Hadoop生态系统

本文链接：https://blog.csdn.net/jiacai2050/article/details/8591577

版权

Hadoop生态系统专栏收录该内容

20 篇文章 2 订阅

订阅专栏

WordCount2中我们使用Hadoop框架中给我们提供的类来实现，我们的目的是用最少的代码来完成同样的任务

import java.io.IOException;

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.lib.LongSumReducer;
import org.apache.hadoop.mapred.lib.TokenCountMapper;



public class WordCount2 {

	public static void main(String[] args) {
		JobClient job =new JobClient();
		JobConf conf = new JobConf(WordCount2.class);
		
		FileInputFormat.addInputPath(conf, new Path(args[0]));
		FileOutputFormat.setOutputPath(conf, new Path(args[1]));
		
		conf.setOutputKeyClass(Text.class);
		conf.setOutputValueClass(LongWritable.class);
		
		conf.setMapperClass(TokenCountMapper.class);
		conf.setCombinerClass(LongSumReducer.class);
		conf.setReducerClass(LongSumReducer.class);
		
		job.setConf(conf);
		
		try {
			JobClient.runJob(conf);
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

on_way_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
WordCount2

WordCount2中我们使用Hadoop框架中给我们提供的类来实现，我们的目的是用最少的代码来完成同样的任务import java.io.IOException;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;impo
复制链接

扫一扫

专栏目录