背景
MapReduce作为分布式计算框架,一般情况下要依赖于HDFS在linux环境下运行,打包运行成本高,但我们开发时往往在Windows环境下,有没有一种方式在Windows上像调试普通程序一样调试MR程序呢?
RunJar是Hadoop提供的工具包,专门用于运行jar文件的程序,结合Maven工具,可以实现在Windows环境下调试MR程序的目的。
调试方法(以WordCount为例)
1.使用Maven构成MR工程
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<modelVersion>4.0.0</modelVersion>
<groupId>com.hikdata</groupId>
<artifactId>mapreduce-test</artifactId>
<version>1.0.0</version>
<properties>
<hadoop.version>2.7.3</hadoop.version>
</properties>
<dependencies>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${
hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId>