Windows下使用IDEA+Maven搭建本地Hadoop环境

最新推荐文章于 2024-08-22 09:56:49 发布

风云诀4

最新推荐文章于 2024-08-22 09:56:49 发布

阅读量2k

点赞数 5

分类专栏： # 大数据实验文章标签： MapReduce Maven 本地Hadoop环境 IDEA

本文链接：https://blog.csdn.net/qq_42582489/article/details/103359703

版权

大数据实验专栏收录该内容

13 篇文章 1 订阅

订阅专栏

IDEA结合Maven搭建本地MapReduce环境

文章目录

IDEA结合Maven搭建本地MapReduce环境

前言

Hadoop的开发中需要很多的依赖包，相互之间的关系较为复杂，依赖包之间复杂的关系就导致了搭建Hadoop的过程中会遇到各种报错，费心费神还调试不好，真是让人苦恼。

Maven是一个依赖管理和项目构建的工具，它利用惯例组织Java项目的结构，并允许通过简单的配置定义直接依赖，而直接依赖所需的其他依赖则会通过事先定义好的关系列表自动下载，大大节省了开发者本身的工作量。

使用Maven管理依赖，可以把MapReduce程序看出一个普通的Java程序一样来运行和调试，不需要在真实的分布式Hadoop集群上运行，真是好用又方便。

Maven是一个项目管理工具，在主流的Java IDE上都有插件。这里我们推荐使用IntelliJ IDEA来配合Maven，相比于Eclipse，IDEA更智能、更迅速、体验更佳。以 IDEA Ultimate 2019.3 版本为例，它自带了Maven支持，都不需要安装插件。

环境

JDK 1.7及1.7以上版本
IntelliJ IDEA Ultimate

不需要安装任何形式的Hadoop集群

如果不知道 IDEA怎么下载和安装的，可以参考另一篇博客 Windows下配置IDEA开发环境

配置Maven

新建项目

配置Maven的时候请一定要保持网络连接，不要断网

打开 IDEA，新建一个项目。点击 $F i l e$ -> $N e w$ -> $P r o j e c t$
101
在弹出的对话框中选择 $M a v e n$ ，JDK选择自己安装的版本，点击Next
102
Location对应安装位置，选择到你想要安装的文件夹，比如我这里选择的是“D:\Dpan\Java”，系统提示当前目录非空
103
我在后面再添加“\bigdata”，提示通过，意味着点击 finish 之后系统在“D:\Dpan\Java”这个目录下会创建一个叫做 bigdata 的空文件夹来存放这个项目（当然你也可以在电脑中提前建立一个空文件夹再选择其为安装位置），点击 finish 确定
104

初始化

IDEA 初始化项目之后，会在右下角提示Maven需要导入一些东西，这里我们选择 Enable Auto-Import（自动导入）
105
耐心等待两三分钟，等待项目导入初始化依赖结束，左下角的 Build 框中 Sync 前面转圈就是在导入依赖，出现绿色对号即意味着初始化结束。
106
在项目的左侧有文件目录结构，双击以编译 $p o m . x m l$ ，这是Maven的配置文件
107

添加apache源

在 $p r o j e c t$ 内尾部添加代码

<repositories>
    <repository>
        <id>apache</id>
        <url>http://maven.apache.org</url>
    </repository>
</repositories>

IDEA 会开始自动从网络上下载依赖包并导入，窗口的最底部会开始转圈，转圈结束就表示apache源添加成功。

添加Hadoop依赖

这里只需要用到基础依赖 $h a d o o p - c o r e$ 和 $h a d o o p - c o m m o n$ ；如果需要读写HDFS，则还需要依赖 $h a d o o p - h d f s$ 和 $h a d o o p - c l i e n t$ ；如果需要读写HBase，则还需要依赖 $h b a s e - c l i e n t$ 。

在 $p r o j e c t$ 内尾部添加代码

<dependencies>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-core</artifactId>
        <version>1.2.1</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-common</artifactId>
        <version>2.7.2</version>
    </dependency>
</dependencies>

同样，等待转圈结束，Hadoop依赖就添加成功了。

修改 $p o m . x m l$ 完成后，IDEA 会提示 Maven projects need to be Imported，点击Import Changes以更新依赖

到这一步之后，Maven 环境就算搭建完毕，可以直接使用此项目编写和运行 MapReduce 程序了。

下一步怎么通过IDEA+Maven运行MapReduce程序，请参考下一篇博客 IDEA+Maven运行调试MapReduce程序