wordCount案例在集群上测试

最新推荐文章于 2021-09-17 08:00:08 发布

daladalabao

最新推荐文章于 2021-09-17 08:00:08 发布

阅读量247

点赞数 1

分类专栏： hadoop mapReduce 文章标签： mapreduce hadoop

本文链接：https://blog.csdn.net/qq_45450889/article/details/111357697

版权

hadoop 同时被 2 个专栏收录

23 篇文章 1 订阅

订阅专栏

mapReduce

10 篇文章 0 订阅

订阅专栏

修改Driver.java

Job job = Job.getInstance();   //封装成Job对象

        //指明main方法在Driver类中
        job.setJarByClass(Driver.class);

        job.setMapOutputKeyClass(Text.class);//map输出的key的类型
        job.setMapOutputValueClass(IntWritable.class);

        job.setOutputKeyClass(Text.class);//reducer输出的key的类型
        job.setOutputValueClass(IntWritable.class);

        job.setMapperClass(WordCountMapper.class);//设置返回的类型
        job.setReducerClass(WordCountReducer.class);

        FileInputFormat.setInputPaths(job,new Path(args[0]));//读取文件路径
        FileOutputFormat.setOutputPath(job,new Path(args[1]));//结果输出的路径


        job.waitForCompletion(true);//完成之后退出

配置信息

<build>
        <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>2.3.2</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
            <plugin>
                <artifactId>maven-assembly-plugin </artifactId>
                <configuration>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                    <archive>
                        <manifest>
                        <!-- Driver的全路径 -->
                            <mainClass>mapreduce.Driver</mainClass>
                        </manifest>
                    </archive>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>single</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>

打包

idea右侧maven lifecycle—>package—>绿色三角运行
文件下会出现target，下面会有2个jar包，选择没有依赖的，复制到集群上
集群
1. 先启动进程
2. 执行命令
  命令格式：
  hadoop jar jar包全路径 Driver类全路径要进行计算的文件的全路径输出结果的全路径
  hadoop jar wordCount.jar mapreduce.Driver /hduser/input/wc.input /hduser/output1
  `