基于Eclipse的Hadoop应用开发环境配置

转自:http://www.cnblogs.com/flyoung2008/archive/2011/12/09/2281400.html

我的开发环境:

操作系统centos5.5 一个namenode 两个datanode

Hadoop版本:hadoop-0.20.203.0

Eclipse版本:eclipse-java-helios-SR2-linux-gtk.tar.gz(使用3.7的版本总是崩溃,让人郁闷)

第一步:先启动hadoop守护进程

具体参看:http://www.cnblogs.com/flyoung2008/archive/2011/11/29/2268302.html

第二步:在eclipse上安装hadoop插件

1.复制 hadoop安装目录/contrib/eclipse-plugin/hadoop-0.20.203.0-eclipse-plugin.jar 到 eclipse安装目录/plugins/ 下。 

2.重启eclipse,配置hadoop installation directory。 
如果安装插件成功,打开Window-->Preferens,你会发现Hadoop Map/Reduce选项,在这个选项里你需要配置Hadoop installation directory。配置完成后退出。

3.配置Map/Reduce Locations。 
在Window-->Show View中打开Map/Reduce Locations。 
在Map/Reduce Locations中新建一个Hadoop Location。在这个View中,右键-->New Hadoop Location。在弹出的对话框中你需要配置Location name,如Hadoop,还有Map/Reduce Master和DFS Master。这里面的Host、Port分别为你在mapred-site.xml、core-site.xml中配置的地址及端口。如:

Map/Reduce Master

192.168.1.101
9001

DFS Master

192.168.1.101
9000

配置完后退出。点击DFS Locations-->Hadoop如果能显示文件夹(2)说明配置正确,如果显示"拒绝连接",请检查你的配置。


第三步:新建项目。 
File-->New-->Other-->Map/Reduce Project 
项目名可以随便取,如WordCount。 
复制 hadoop安装目录/src/example/org/apache/hadoop/example/WordCount.java到刚才新建的项目下面。 

第四步:上传模拟数据文件夹。 
为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。
在本地新建word.txt

java c++ python c
java c++ javascript 
helloworld hadoop
mapreduce java hadoop hbase 

通过hadoop的命令在HDFS上创建/tmp/workcount目录,命令如下:bin/hadoop fs -mkdir /tmp/wordcount

通过copyFromLocal命令把本地的word.txt复制到HDFS上,命令如下:bin/hadoop fs -copyFromLocal /home/grid/word.txt  /tmp/wordcount/word.txt


第五步:运行项目

1.在新建的项目Hadoop,点击WordCount.java,右键-->Run As-->Run Configurations 
2.在弹出的Run Configurations对话框中,点Java Application,右键-->New,这时会新建一个application名为WordCount 
3.配置运行参数,点Arguments,在Program arguments中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:

hdfs://centos1:9000/tmp/wordcount/word.txt   hdfs://centos1:9000/tmp/wordcount/out

4、如果运行时报java.lang.OutOfMemoryError: Java heap space 配置VM arguments(在Program arguments下)

-Xms512m -Xmx1024m -XX:MaxPermSize=256m

5.点击Run,运行程序。 

点击Run,运行程序,过段时间将运行完成,等运行结束后,查看运行结果,使用命令: bin/hadoop fs -ls /tmp/wordcount/out查看例子的输出结果,发现有两个文件夹和一个文件,使用命令查看part-r-00000文件, bin/hadoop fs -cat /tmp/wordcount/out/part-r-00000可以查看运行结果。

c    1
c++    2
hadoop    2
hbase    1
helloworld    1
java    3
javascript    1
mapreduce    1
python    1
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 这个问题中涉及了EclipseHadoop开发环境配置。要解决这个问题,需要按照一定的步骤配置EclipseHadoop的连接。具体可以参考官方文档或者各种教程。一般需要安装Eclipse插件或者Hadoop相关的工具包,然后在Eclipse配置Hadoop的一些参数和路径,最终可以实现在Eclipse中编写和调试Hadoop程序的功能。 ### 回答2: 在Eclipse配置Hadoop开发环境需要安装相关插件和配置一些参数。以下是具体的步骤: 第一步:下载Eclipse插件 首先需要下载Eclipse插件,建议下载CDH5 Eclipse插件,因为该插件支持CDH 5.x云环境,CDH5是针对Hadoop的一个完整、开放的平台。下载完成插件后,将插件复制到Eclipse安装目录下的dropins文件夹中。 第二步:配置Hadoop运行环境Eclipse配置Hadoop开发环境需要配置Hadoop运行环境,可以通过以下步骤实现: 1.首先在Eclipse中新建一个Java项目,然后右键单击项目名称,选择“Build Path”>“Configure Build Path”。 2.在弹出的对话框中,选择“Libraries”标签页,并单击“Add Library”按钮。 3.在下一个对话框中,选择“User Library”,然后单击“Next”按钮。 4.在“User Libraries”的对话框中,单击“New”按钮,创建一个新的库,取名为“Hadoop”。 5.选择新建的“Hadoop”库,在右侧的“Add External JARs”中添加Hadoop所有的JAR文件。 6.单击“OK”按钮保存设置。 第三步:设置环境变量 将Hadoop的bin目录添加到系统的PATH环境变量中,这样可以在Eclipse中直接调用Hadoop命令。具体操作步骤如下: 1.在Windows系统中,右键单击“计算机”图标,选择“属性”,在打开的窗口中单击“高级系统设置”。 2.在弹出的对话框中,单击“环境变量”按钮。 3.在下面的对话框中,找到“系统变量”中的“PATH”变量,双击进行编辑。 4.在编辑窗口的末尾添加Hadoop的bin目录,例如:D:\hadoop-2.6.0\bin 5.单击“确认”保存设置。 第四步:创建Hadoop项目 在Eclipse中创建Hadoop项目需要先创建一个Java项目,然后将其转换成Hadoop项目,具体步骤如下: 1.在Eclipse中新建一个Java项目。 2.右键单击项目名称,选择“Configure”>“Convert to Hadoop Project”。 3.在弹出的对话框中,选择Hadoop版本,配置Hadoop相关参数,单击“Finish”创建项目。 至此,Eclipse配置Hadoop开发环境完成。可以在Eclipse开发Hadoop应用程序并进行调试和测试。 ### 回答3: Hadoop是一个开源分布式计算框架,可以让我们方便地处理大规模数据。在使用Hadoop进行开发时,我们可以使用Eclipse配置开发环境,轻松地完成MapReduce程序的编写,运行和调试。 下面是在Eclipse配置Hadoop开发环境的步骤: 1. 下载并安装Eclipse:根据操作系统选择合适的版本进行下载并安装。 2. 下载并安装Hadoop:同Eclipse,选择适合的版本进行下载并安装。将Hadoop解压缩到合适的目录下,记住路径,后面会用到。 3. 在Eclipse中安装Hadoop插件:打开Eclipse,点击菜单栏的“Help”-“Eclipse Marketplace”搜索栏中输入“hadoop”,然后在结果中找到“Hadoop Eclipse Plugin”进行安装。 4. 配置Hadoop插件:在Eclipse中打开“Preference”对话框,选择“Hadoop”选项卡,配置Hadoop的路径和JDK的路径等信息,注意这里要配置Hadoop的路径,否则会出现无法找到Hadoop的情况。配置完成后点击“Apply”保存。 5. 新建Hadoop MapReduce项目:在Eclipse的Project Explorer中右键单击“New”-“Project”选择“MapReduce Project”,填写项目的基本信息后点击“Finish”开始创建项目。 6. 编写MapReduce程序:在新创建的项目中创建一个类,并实现MapReduce Job的两个方法,即“map”方法和“reduce”方法。 7. 运行和调试MapReduce程序:在Eclipse的菜单栏中选择“Run”-“Run Configurations”进行配置,设置好输入和输出路径,然后点击“Run”就可以运行程序。如果需要调试程序,可以在代码中设置断点,然后在Eclipse的菜单中选择“Debug”进行调试。 以上就是在Eclipse配置Hadoop开发环境的步骤,通过上面的操作,我们可以轻松地完成MapReduce程序的开发和调试,提高开发效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值