Tips:本文是针对分布式Hadoop集群环境来讲,在阅读本文前请确保机器已经安装好Hadoop集群并且正常启动。由于eclispe必须图形化操作,如果想要图形化操作远程机器可以安装VNC。(VNC安装请查看本博客的VNC安装使用说明)
1、准备工作
下载eclipse官网地址:http://www.eclipse.org/downloads/任意选一个版本如:eclipse-SDK-4.5M1-linux -gtk.tar.gz
下载hadoop-eclipse-plugin地址:http://download.csdn.net/detail/jxmykl/7786833
2、安装
l 将eclipse-SDK-3.7.2-linux-gtk.tar.gz复制到/home/hadoop文件夹下
l 进入hadoop目录下: cd /home/Hadoop
l 安装eclipse: tar-zxvf eclipse-SDK-4.2-linux-gtk.tar.gz
l 将下载的hadoop-eclipse-plugin拷贝到eclispe/plugin/文件夹下
l 启动eclipse[前提是进入图形界面,单击eclispe文件下的eclispe图标]
l 启动eclispe后在菜单栏找到windoe----Preference选择HadoopMap/Reduce选项
l 即可新建项目进行编程
3、例子:
NewProject----选择Map/Reduce Project(此处和windows下操作相同)
使用下列例子测试环境是否成功
import java.io.IOException;
import java.util.StringTokenizer;
importorg.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
importorg.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
importorg.apache.hadoop.mapreduce.Map