配置完成之后才想起来要写个总结,没有办法及时配图,下次配置的时候补上。
配置时参考了 http://blog.csdn.net/hguisu/article/details/7237395 很详细,怒赞加顶。
配置前需要确定本机的ip地址。本人是在ubuntu12.04下配置的,在12.10下配的时候,遇见了文件源数据不全,无法配置ssh的问题,希望有解决该问题的同学提供方法。
配置hadoop的Datanode大概分为3步,配置java,配置ssh,配置hadoop,三个情况。需要再次强调,本文只是针对在已有集群在添加datanode的情况,如果要从namenode开始配置需要参考上面提供的ip。
1.建立用户。
首先需要将namenode里的 /etc/hosts 添加datanode的名称和ip。然后拷贝到datanode下。
远程namenode ssh namenode@ip
scp /etc/hosts datanode@ip /etc/hosts
然后创建用户
sudo useradd -m username // username表示新创建的用户命 -m 表示创建用户并在/home下创建一个与用户命相同的文件夹
passwd username 然后就需要你写密码了
2.创建java环境
如果不知道linux软件包中带的java版本,可以先输入jps查看。
sudo apt-get install openjdk-6-java 这样安装的jdk会存在 /usr下
在之后配置hadoop时,java目录