声明:Hadoop相关资料,最好参考官方文档,根据需要,选择参考不同版本:
当前版本,http://hadoop.apache.org/docs/current/
版本列表,http://hadoop.apache.org/docs/
本文采用的是Hadoop版本为0.20.2,系统为Mac OS X 10.7.5。
0. 下载Hadoop
https://archive.apache.org/dist/hadoop/core/hadoop-0.20.2/
1. Java环境搭建:
略
2. 将Hadoop解压缩:
$ tar xvzf hadoop-0.20.2.tar.gz
3. $ vim hadoop-0.20.2/conf/hadoop-env.sh,配置JAVA_HOME:
添加双引号内部分,“export JAVA_HOME=/System/Library/Java/JavaVirtualMachines/1.6.0.jdk/Contents/Home”
4. 为Hadoop修改环境变量,(1)、(2)任选一:
(1) 全局修改:
$ vim /etc/paths
添加双引号内部分,“/Users/waterforest/Hadoop/hadoop-0.20.2/bin”
(2) 用户修改:
$ vim ~/.profile
添加双引号内部分,”export PATH=$PATH:/Users/waterforest/Hadoop/hadoop-0.20.2/bin“
测试1:
$ hadoop version
看到以下内容则表示配置成功:
Hadoop 0.20.2
Subversion https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707
Compiled by chrisdo on Fri Feb 19 08:07:34 UTC 2010
测试2:
$ cd hadoop-0.20.2
$ mkdir input
$ cp conf/*.xml input
$ hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
$ cat output/*
看到以下内容,则表示配置成功:
1 dfsadmin