IDEA上编写hadoop程序(Maven)【笔记自用】

说明:在IDEA上进行编写简单的hadoop程序,适用于个人简单入门

版本:IDEA2019.3.3 + Hadoop2.6 + java8 + win10

系列:
一,创建项目

1,创建项目
在这里插入图片描述
 2,选择Maven,选择自己的JDK,不用选择Create from archetype(创建表单原型),点击Next
 在这里插入图片描述
3,输入想要创建项目的Name(名称)和Location(工作区),这里输入的项目名称为WordCount,点击FilnishIEDA会帮你创建好项目的基础结构
在这里插入图片描述
3.1,IDEA2019.3.3之前(可能)的版本,还需要填写GroupID(组名称), ArtifactId(名称), Version(版本)
在这里插入图片描述
二,配置Maven POM

1,POM是Maven工程的基本工作单元,是一个XML文件,包含了项目的基本信息,用于描述项目如何构建,声明项目依赖,等等。了解Maven pom
在这里插入图片描述
2,清空pom.xml文件,直接把下面代码复制到pom.xml文件里

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>dblab</groupId>
    <artifactId>WordCount</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <hadoop.version>2.6.0</hadoop.version>
    </properties>

    <dependencies>
        <!-- Hadoop -->
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-core</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-jobclient</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
    </dependencies>

    <build>
        <plugins>
            <!-- Java 1.8 -->
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.6.0</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
        </plugins>
    </build>

</project>

复制后如下
在这里插入图片描述
3,点击右下角弹框import changes(导入更改)或者enable auto-import(启用自动导入)更新pom.xml文件
在这里插入图片描述
4,打开右上角的Maven。如果你之前没有下载相应的jar包,Maven会帮你下载在pom.xml文件中导入的包

右下角会显示下载的进度条
在这里插入图片描述
三,创建类

1.创建 WordCount类,在WordCount -> src -> main -> java 中右键 new 一个 Java Class,输入WordCount类名创建类
在这里插入图片描述在Maven中,测试的类放在src -> test -> java文件夹中,这些类一般选择不打进jar包中。
四,打包(jar包)

Artifacts的作用是整合编译后的 java 文件,资源文件等。

1,点击 File -> Project Structure
  在这里插入图片描述
  2,点击 Artifacts -> + -> JAR -> Form modules with dependencies
  在这里插入图片描述

3,这里默认就好,直接点击 OK 就行了。

Module 是模块名。Main Class 是入口类,为了方便切换入口类,所以现在不选择,等运行jar包的时候才选择入口类。

由于是为了运行简单的hadoop程序,选择extract to the target JAR(提取到目标JAR)就行了,这样不会生成MANIFEST.MF文件。如果需要使用hadoop不附带的额外依赖jar包,可以把jar包放在hadoop内:hadoop路径/share/hadoop/common/
在这里插入图片描述
4.删除依赖jar包

先选择第一个要删除的jar包

在这里插入图片描述
按住Ctrl键后按住向下键选择全部要删除的jar包,然后鼠标右键,选择Remove删除
在这里插入图片描述
删除后如图,点击下面的OK就行了
在这里插入图片描述
  5,点击上面的Build后选择Build Artifacts,在弹出的选择框中选择Build,
  在这里插入图片描述
在这里插入图片描述
6,就可以在out文件夹中找到项目生成的jar包,直接复制出来就可以上传到linux系统上运行
在这里插入图片描述
7,如果有错误提示,可以复制到百度查询。比如java版本错误提示,修改默认java版本即可。
在这里插入图片描述
五,运行jar包

(需要配置用户变量)命令框架为:hadoop jar jar包

由于打包过程没有指定入口类,所以命令为:hadoop jar WordCount.jar WordCount

由于程序没有指定资源输入输出路径,所以命令为:hadoop jar WordCount.jar WordCount input/word.txt output

  • 3
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值