1,添加专用的hadoop系统用户
添加组hadoop,添加组用户hduser
$ sudo addgrouphadoop
$ sudo adduser --ingroup hadoop hduser
2, 安装openssh server(伪分步模式需要用到)。hadoop需要ssh权限管理节点(nodes),
$ sudo apt-getinstall ssh
$ sudo apt-getinstall rsync
参考: <http://fuliang.iteye.com/blog/562396>
首先,为hduser生成ssh key。
$ su - hduser
$ssh-keygen -t rsa
用空密码创建ssh key pair
第二,让ssh用新创建的key访问本地机器
cat$HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
第三,通过连接本机用hduser测试ssh安装
3,下载安装hadoop
下载地址:http://www.apache.org/dyn/closer.cgi/hadoop/core
我下载了最新的hadoop1.1.1版本
解压到 /user/local目录下,重命名hadoop1.1.1为hadoop,然后给hduser设置权限
$ cd /usr/local
$ sudo tar xzf hadoop-1.1.1.tar.gz
$ sudo mv hadoop-1.1.1 hadoop
$ sudo chown -Rhduser:hadoop hadoop
4,修改/usr/local/hadoop/conf/hadoop-env.sh
如果发现hadoop-env.sh的权限是read-only时,可以sudo chmod +x hadoop-env.sh 来修改权限
gedit/usr/local/hadoop/conf/hadoop-env.sh
添加export JAVA_HOME=/usr/lib/jvm/java7
5,用jps查看hadoop是否在运行
hduser@ubuntu:/usr/local/hadoop$jps
5012 Jps
jps在/usr/lib/jvm/java7/bin目录下
别名:aliasjps='/usr/lib/jvm/jdk1.6.0_33/bin/jps'
sudo update-alternatives--install /usr/bin/jps jps /usr/lib/jvm/java7/bin/jps
参考:
http://www.cnblogs.com/xioyaozi/archive/2012/05/26/2519144.html
http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/