我也是刚学!可能有些地方也是不太清楚。
步骤:1.安装vmware;
2.安装Ubuntu(建议安装时顺便安装虚拟工具可共享本地磁盘中的文件便于复制http://jingyan.baidu.com/article/597a0643904279312b5243d9.html?pu=sz@224_240,os@&st=&bd_page_type=1&os=&rst=;
3.win7下解压下载好的hadoop文件
4.ubuntu下伪分布安装hadoop(先安装单机版)http://www.cnblogs.com/kinglau/p/3796164.html
安装过程中有几点要注意:一、native库可能字位不对,官网下载的默认是64位,如果要32位的自己下载源码包自已编译!http://blog.sina.com.cn/s/blog_549667a50102v83x.html
二、可能会有文件夹权限问题,如果报错将文件夹权限改为774,然后用当前账户建立文件夹。(不要用sudo)
如果正常启动应该会有datanode,namenode,nodemanager,secondarynode,resourcemanager五个守护线程!
5.win7下安装jdk环境,myeclipse,下载hadoop.dll,winutils.exe
6.将winutils.exe放置hadoop目录的bin下,hadoop.dll放在system32下 ,添加环境变量hadoop_home
7.下载hadoop-eclipse-plugin-2.6.0.jar放在myeclipse目录的dropins下并删除configuration的org.eclipse.update文件夹
8.myeclipse连接dfs,建议将hadoop的localhost换成Ubuntu的ip。
9.在myeclipse中配置hadoop路径。
然后就可新建mapreduce项目了http://www.cnblogs.com/kinglau/p/3802705.html,将文中的输入输出路径改为自己的!
相关文件下载http://download.csdn.net/download/u010813622/8557069