一、下载hadoop
进入http://hadoop.apache.org/官网,下载需要的hadoop版本,本测试使用hadoop-1.2.1-bin.tar.gz,下载后,解压文件。
版本说明请参考http://book.51cto.com/art/201312/422133.html
二、安装JDK
本测试环境为ubuntu13.04,在ubuntu上安装openjdk很方便,只需要一条命令就好了。
$ sudo apt-get install openjdk-7-jdk
更多内容清参考http://openjdk.java.net/install/index.html
三、安装其他软件
$ sudo apt-get install ssh
$ sudo apt-get install rsync
设置ssh为免密码登陆
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >>~/.ssh/authorized_keys
四、修改hadoop环境配置文件,添加JDK安装目录
进入conf/hadoop-env.sh 文件
添加export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386
五、修改hadoop其他配制文件
conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
六、运行
1、格式化hadoop的文件系统HDFS
$ bin/hadoop namenode -format
2、运行hadoop
$ bin/start-all.sh
3、检验是否安装成功
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/
4、退出hadoop
$ bin/stop-all.sh