[Hadoop源码解读]（三）MapReduce篇之Job类

最新推荐文章于 2022-04-24 19:06:02 发布

VIP文章 posa88

最新推荐文章于 2022-04-24 19:06:02 发布

阅读量6.8k

点赞数 1

分类专栏： Hadoop源码解读

本文链接：https://blog.csdn.net/posa88/article/details/7902709

版权

下面，我们只涉及MapReduce 1，而不涉及YARN。

当我们在写MapReduce程序的时候，通常，在main函数里，我们会像下面这样做。建立一个Job对象，设置它的JobName，然后配置输入输出路径，设置我们的Mapper类和Reducer类，设置InputFormat和正确的输出类型等等。然后我们会使用job.waitForCompletion()提交到JobTracker，等待job运行并返回，这就是一般的Job设置过程。JobTracker会初始化这个Job，获取输入分片，然后将一个一个的task任务分配给TaskTrackers执行。TaskTracker获取task是通过心跳的返回值得到的，然后TaskTracker就会为收到的task启动一个JVM来运行。

        Configuration conf = getConf();  
        Job job = new Job(conf, "SelectGradeDriver");  
        job.setJarByClass(SelectGradeDriver.class);   
          
        Path in = new Path(args[0]);  
        Path out = new Path(args[1]);  
          
        FileInputFormat.se

最低0.47元/天解锁文章

优惠劵

posa88

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
[Hadoop源码解读]（三）MapReduce篇之Job类

下面，我们只涉及MapReduce 1，而不涉及YARN。当我们在写MapReduce程序的时候，通常，在main函数里，我们会像下面这样做。建立一个Job对象，设置它的JobName，然后配置输入输出路径，设置我们的Mapper类和Reducer类，设置InputFormat和正确
复制链接

扫一扫