Windows下使用IDEA+Maven搭建本地Hadoop环境

IDEA结合Maven搭建本地MapReduce环境

前言

Hadoop的开发中需要很多的依赖包,相互之间的关系较为复杂,依赖包之间复杂的关系就导致了搭建Hadoop的过程中会遇到各种报错,费心费神还调试不好,真是让人苦恼。

Maven是一个依赖管理和项目构建的工具,它利用惯例组织Java项目的结构,并允许通过简单的配置定义直接依赖,而直接依赖所需的其他依赖则会通过事先定义好的关系列表自动下载,大大节省了开发者本身的工作量。

使用Maven管理依赖,可以把MapReduce程序看出一个普通的Java程序一样来运行和调试,不需要在真实的分布式Hadoop集群上运行,真是好用又方便。

Maven是一个项目管理工具,在主流的Java IDE上都有插件。这里我们推荐使用IntelliJ IDEA来配合Maven,相比于Eclipse,IDEA更智能、更迅速、体验更佳。以 IDEA Ultimate 2019.3 版本为例,它自带了Maven支持,都不需要安装插件。

环境

  1. JDK 1.7及1.7以上版本
  2. IntelliJ IDEA Ultimate

不需要安装任何形式的Hadoop集群

如果不知道 IDEA怎么下载和安装的,可以参考另一篇博客 Windows下配置IDEA开发环境

配置Maven

新建项目

配置Maven的时候请一定要保持网络连接,不要断网

打开 IDEA,新建一个项目。点击 F i l e File File -> N e w New New -> P r o j e c t Project Project
101
在弹出的对话框中选择 M a v e n Maven Maven,JDK选择自己安装的版本,点击Next
102
Location对应安装位置,选择到你想要安装的文件夹,比如我这里选择的是“D:\Dpan\Java”,系统提示当前目录非空
103
我在后面再添加“\bigdata”,提示通过,意味着点击 finish 之后系统在“D:\Dpan\Java”这个目录下会创建一个叫做 bigdata 的空文件夹来存放这个项目(当然你也可以在电脑中提前建立一个空文件夹再选择其为安装位置),点击 finish 确定
104

初始化

IDEA 初始化项目之后,会在右下角提示Maven需要导入一些东西,这里我们选择 Enable Auto-Import(自动导入)
105
耐心等待两三分钟,等待项目导入初始化依赖结束,左下角的 Build 框中 Sync 前面转圈就是在导入依赖,出现绿色对号即意味着初始化结束。
106
在项目的左侧有文件目录结构,双击以编译 p o m . x m l pom.xml pom.xml ,这是Maven的配置文件
107

添加apache源

p r o j e c t project project 内尾部添加代码

<repositories>
    <repository>
        <id>apache</id>
        <url>http://maven.apache.org</url>
    </repository>
</repositories>

IDEA 会开始自动从网络上下载依赖包并导入,窗口的最底部会开始转圈,转圈结束就表示apache源添加成功。

添加Hadoop依赖

这里只需要用到基础依赖 h a d o o p − c o r e hadoop-core hadoopcore h a d o o p − c o m m o n hadoop-common hadoopcommon;如果需要读写HDFS,则还需要依赖 h a d o o p − h d f s hadoop-hdfs hadoophdfs h a d o o p − c l i e n t hadoop-client hadoopclient;如果需要读写HBase,则还需要依赖 h b a s e − c l i e n t hbase-client hbaseclient

p r o j e c t project project 内尾部添加代码

<dependencies>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-core</artifactId>
        <version>1.2.1</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-common</artifactId>
        <version>2.7.2</version>
    </dependency>
</dependencies>

同样,等待转圈结束,Hadoop依赖就添加成功了。

修改 p o m . x m l pom.xml pom.xml 完成后,IDEA 会提示 Maven projects need to be Imported,点击Import Changes以更新依赖

到这一步之后,Maven 环境就算搭建完毕,可以直接使用此项目编写和运行 MapReduce 程序了。

下一步怎么通过IDEA+Maven运行MapReduce程序,请参考下一篇博客 IDEA+Maven运行调试MapReduce程序

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值