自己研究大数据一年多了,虽然技术上有很多提高,但是有个问题就是一直没法使用本地联调集群,每次都是写完打包放到集群执行。最近发现可以本地直接连接远程联调,大大提高了开发效率,分享一下。
1、下载hadoop,配置到本地环境变量中,路径中最好不要有空格或下划线
环境变量:
2、修改项目的pom.xml
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId>
<version>${hadoop.version}</version>
</dependency&