今天去学校里的研究生实验室看了下视频大数据处理这块,其中要用到hadoop技术,自己对分布式开发虽然不了解,但是感觉很感兴趣。研2的学长人很好,愿意带着我跟他们一起做项目。确实有点压力,但是努力吧。。
言归正传,配置过程主要分为两步
1:jdk的配置。详情请看jdk的配置
2:hadoop的安装 下载地址 http://labs.xiaonei.com/apache-mirror/hadoop/core/hadoop-0.20.2/hadoop-0.20.2.tar.gz
1、安装java和ssh
在Ubuntu下使用apt-get就可以很方便地将JDK和ssh安装好,Ubuntu一般默认安装有ssh客户端,并没有安装服务器端,输入"apt-get install ssh"便会将服务器安装好,然后使用"/etc/init.d/ssh start"将服务器运行起来。
2、创建hadoop用户组和hadoop用户
#addgroup hadoop
#adduser --ingroup hadoop hadoop
3、配置ssh
切换到hadoop用户下
#su - hadoop
生成密钥对
hadoop@ubuntu:~$ssh-keygen -t rsa -P ""
将公钥拷贝到服务器上
hadoop@ubuntu:~$cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
4、安装Hadoop
Hadoop不需要安装解压后就可以用了,以root用户运行下面的命令。
#cd /usr/local
#tar xzf hadoop-0.20.0.tar.gz
#mv hadoop-0.20.0 hadoop
#chown -R hadoop:hadoop hadoop
5、配置Hadoop
打开conf/hadoop-env.sh,修改其中一句就ok了。将“#export JAVA_HOME=/usr/lib/j2sdk1.5-sun”改成“export JAVA_HOME=/usr/lib/jvm/java-6-sun“就好了(此处去掉了#),当然要看安装的java版本了,Ubuntu 9.10的源的Java版本就是1.6。
接着修改core-site.xml文件,填入以下内容(/usr/local/hadoop-datastore/hadoop-hadoop目录必须存在(没有的话自己新建),并且需要将目录属主改成hadoop用户,${user.name}这个变量不知道是哪儿定义的):此处一定要记住为hadoop用户获取权限(最好只获得该目录,多了的话容易出问题)<