1、 安装开发hadoop插件
将hadoop安装包hadoop\contrib\eclipse-plugin\hadoop-0.20.2-eclipse-plugin.jar拷贝到eclipse的插件目录plugins下。
需要注意的是插件版本(及后面开发导入的所有jar包)与运行的hadoop一致,否则可能会出现EOFException异常。
重启eclipse,打开windows->open perspective->other->map/reduce 可以看到map/reduce开发视图。
2、设置连接参数
打开windows->show view->other-> map/reduce Locations视图,在控制台新建hadoop location
(1)General选项卡各个参数说明:
Location name:本地视图的location名称,自己自定义一个名称即可
Map/Reduce Master组内 host和port: 为 Map/Reduce Master的地址与端口号,此地址端口与hadoop服 务器安装配置过程中 conf/mapred-site.xml文件中 mapred.job.tracker节点值一致。
DFS Master组内host和port: 此为HDFS服务器Master的地址与端口号, 此地址与hadoop服务器安装配置 过程中 conf /core-site.xml文件中 fs.default.name节点值一致。
Username: 远程hadoop服务器登陆用户名。
SOCKS proxy: 如果登陆hadoop服务器需要代理的话,此组填入代理服务器的地址和端口
(2)Advanced parameters选项卡部分参数说明(各个未提及参数请参见hadoop官方文档):
fs.defualt.name:与core-site.xml里fs.default.name设置一致。
mapred.job.tracker:与mapred-site.xml里面mapred.job.tracker设置一致。
dfs.replication:与hdfs-site.xml里面的dfs.replication一致。
hadoop.tmp.dir : HDFS文件存取缓存目录, 此项与hadoop服务器安装配置过程中 conf /core-site.xml文件中 hadoop.tmp.dir节点值一致。
dfs.name.dir: HDFS 的namenode 节点 name存储目录,此项与hadoop服务器安装配置过程中 conf /hdfs-site.xml文件中dfs.name.dir节点值一致。 如此节点未配置,取默认选项 ${ hadoop.tmp.dir }/dfs/name, 此目录 namenode节点上出现
fs.data.dir : HDFS的datanode节点data存储目录,此项hadoop服务器安装配置过程中 conf /hdfs- site.xml文件中dfs.data.dir节点值一致。如此节点未配置,取默认选项 ${ hadoop.tmp.dir }/dfs/data,此目 录在各 datanode节点上出现
Hadoop.job.ugi: 登陆HDFS用户及用户组,使用格式为: 用户名,用户组
问题:
用eclipse连接HDFS但是报Error:failure to login错误:
试试先把原来的那个plugin jar文件从Eclipse/plugins删除,启动eclipse,关闭eclipse,再把修改过的plugin复制到Eclipse/plugins/,启动eclipse,应该就可以了。估计是plugin被eclipse cach住了