hadoop之hadoop-mapreduce-examples-2.7.0.jar

最新推荐文章于 2023-04-20 11:27:06 发布

yibei8811

最新推荐文章于 2023-04-20 11:27:06 发布

阅读量1.1w

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/yibei8811/article/details/46774927

版权

本文通过分析hadoop-mapreduce-examples-2.7.0.jar源码，探讨如何运行WordCount程序，并研究了Runnable Jar的入口确定方式。作者发现ExampleDriver.java是jar的入口点，并通过解压缩和修改后重新测试，展示了map和reduce阶段的日志输出以及Main类中的屏幕输出。

摘要由CSDN通过智能技术生成

前2篇blog中测试hadoop代码的时候都用到了这个jar，那么很有必要去分析一下源码。

分析源码之前很有必要先写一个wordcount，代码如下

package mytest;
import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

  public static class TokenizerMapper
       extends Mapper<Object, Text, Text, IntWritable>{

    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {

最低0.47元/天解锁文章

yibei8811

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
hadoop之hadoop-mapreduce-examples-2.7.0.jar

前2篇blog中测试hadoop代码的时候都用到了这个jar，那么很有必要去分析一下源码。分析源码之前很有必要先写一个wordcount，代码如下package mytest;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;
复制链接

扫一扫

专栏目录