要运行hadoop,要先安装两个软件,一个是Java(1.6或更新的版本),另一个是ssh。Java需要设置好JAVA_HOME变量。
要部署Hadoop,首先要下载,下载地址:http://hadoop.apache.org/。
按照网页的导航,选择最新的稳定版本下载就好了,本人选的是1.0.3版,下载的文件名为“hadoop-1.0.3-bin.tar.gz”。然好解压到你喜欢的文件夹。
进入刚刚解压的hadoop目录,编辑conf/hadoop-env.sh,将# export JAVA_HOME=...取消注释,并修改等号后的路径,使其指向你系统的Java运行路径。
编辑$HOME/username目录下的.bashrc文件,在最后添加以下两行:
export HADOOP_INSTALL=<path-to-hadoop>
export PATH=$PATH:$HADOOP_INSTALL/bin:$HADOOP_INSTALL/sbin
例如你的hadoop目录在/usr/local/bin/hadoop-1.0.3,那么上面两行就是:
export HADOOP_INSTALL=/usr/local/bin/hadoop-1.0.3
export PATH=$PATH:$HADOOP_INSTALL/bin:$HADOOP_INSTALL/sbin
最后重新启动终端,输入hadoop version(注意没有横杠-),如果设置正确就会出现类似以下的信息:
Hadoop 1.0.3
Subversion https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.0 -r 1335192
Compiled by hortonfo on Tue May 8 20:31:25 UTC 2012
From source with checksum e6b0c1e23dcf76907c5fecb4b832f3be
这样hadoop就算安装成功啦。