Hadoop 2.8.4
目的:
在Windows的eclipse运行java程序,调试无报错,打包成jar,上传到linux虚拟机(CentOS 64位),Hadoop2.8.4上进行分布式运算。
过程:
1、下载与Hadoop版本对应的jar包,丰富eclipse的用户库
2、找个你想跑的程序。
3、将程序打包成 .jar
4、把jar上传到hadoop上运行
1、下载与Hadoop版本对应的jar包,丰富eclipse的用户库
要在Linux上的hadoop上运行的java程序,与Windows上的java程序,两者所需要的jar包是不同的,只有导入正确的库函数,才能解决位于import中的报错。
如图是hadoop需要用到的MapReduce,io......的包
要这么做:
(eclipse汉化了,不晓得为啥要汉化,,老手莫笑,,,,,凑合着看吧)
说在前面,将hadoop所有的库都导入,是我懒得一个一个找对应的。。而规则的给库命名,是一个归纳物品习惯的,方便以后使用。
右击所选项目( )---→ 构建路径 ---→ 配置构建路径
点击 “add library” 添加库,
下一步,
用户库-------新建
所需要新建的库名有:
(文章末尾回提供相应jar包下载连接)
输入库名,如“yarn” ,会出现一个空库“yarn” ,选择“yarn”, 点击 “添加外部JAR” 。
点击进入“yarn”文件夹,将如下图所有.jar文件选中,点击右下角“打开”,就算是把jar包导入到了相应的库内了。别忘了,打开如下图所示,“lib”文件夹里还有关于yarn的其他jar包,,统统导入到“yarn”库内。
,
按照此过程,将下图的其他库丰富。