IDEA+Hadoop运行TriangleCount程序

IDEA+Hadoop运行MapReduce程序

IDEA新建项目

首先,请确保电脑上已经安装了 Hadoop 并配置了环境变量。如果没有的话,请参考这篇博客 Windows下配置单机Hadoop环境

首先,打开IDEA,新建一个 Java 项目(不需要从模板创建)
20005

项目名字随便,我们就起为“CloudCalculate”,点击 Finish
20006

项目配置

在菜单栏点击 F i l e File File -> P r o j e c t S t r u c t u r e Project Structure ProjectStructure ,这两处的 SDK 版本要对应才行
20007
20008
点击左侧的 Modules,找到 Sources 配置,这里的 Language level 也要和刚才的 SDK 版本相同才行。
20009

还是在 Modules 下,找到 Dependencies 配置,点击右侧的加号,选择第一个“JARs or directories”。在弹出的窗口中选择当初安装 Hadoop 的路径,导入以下五个 hadoop 的 jar 包依赖。
20010
20012
如果弹出需要 Choose Roots,点击OK就行。
20011

在左侧找到 Artifacts,点击中间的加号,选择 J A R JAR JAR -> e m p t y empty empty。名字随便起,我们就命名为“TriangleCount”。
20013

点击下面“Output Layout”页的加号,选择“Module Output”,点击OK。
20014

检查一个右侧 CloudCalculate 的五个依赖包是否正确。如果是这五个依赖就没有问题。

hadoop-nfs-2.7.7.jar
hadoop-hdfs-2.7.7.jar
xz-1.0.jar
hadoop-mapreduce-example-2.7.7.jar
hadoop-yarn-api-2.7.7.jar

20015

新建Java类

在项目文件目录中右击 src,新建一个 Java class,命名为“Triangle”。
20016

代码的话可以自己尝试着写,这里我们给出一个计算三角形个数的 Java 代码以及测试数据集的百度云地址链接

链接:https://pan.baidu.com/s/1g3-pmUqf7Lfh2NTWe3muow
提取码:fkrs

20023

配置编译器

在菜单栏点击 R u n Run Run -> E d i t C o n f i g u r a t i o n s Edit Configurations EditConfigurations
20017

点击左上方的加号,选择 Application。
20018

名字随便起,我们就命名为“TriangleCount”,Main class 点击右侧···可以选择,我们选择 Triangle。

至于参数 Program argument,因为我们在代码中写了三个 Job,所以我们需要四个参数。参数名可以随便定,第一个参数是输入文件的文件夹,最后一个参数是输出文件的文件夹,我们就命名为

input
tmp1
tmp2
output

参数就填入以下四个,注意用空格分隔。

input/ tmp1/ tmp2/ output/

20019

最后我们需要在 src 的同级目录建立 input 文件夹,并把输入文件放在里面。

右击“CloudCalculate”,选择 N e w New New -> D i r e c t o r y Directory Directory,命名为“input”。
20020
20024

运行程序

至此,该配置的参数已经全部配置完毕,直接点击运行即可。
20021

我们运行的是 HighSchool 数据集,此数据集的运行结果为 34220
20022
由于Hadoop的设定,下次运行之前时要删除 tmp1、tmp2、 output 文件夹。 因为这个项目是建立在D盘,所以每次运行之后,会在D盘生成一个 tmp 文件夹,下次运行前也请删除。

参考博客

Intellij idea开发Hadoop MapReduce程序

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值