能够启动datanode,但无法访问,也无法结束的错误
在 重新格式化一个新的分布式文件时,需要将你NameNode上所配置的dfs.name.dir这一namenode用来存放NameNode 持久存储名字空间及事务日志的本地文件系统路径删除,同时将各DataNode上的dfs.data.dir的路径 DataNode 存放块数据的本地文件系统路径的目录也删除。如本此配置就是在NameNode上删除/home/hadoop/NameData,在DataNode上 删除/home/hadoop/DataNode1和/home/hadoop/DataNode2。这是因为Hadoop在格式化一个新的分布式文件系 统时,每个存储的名字空间都对应了建立时间的那个版本(可以查看/home/hadoop /NameData/current目录下的VERSION文件,上面记录了版本信息),在重新格式化新的分布式系统文件时,最好先删除NameData 目录。必须删除各DataNode的dfs.data.dir。这样才可以使namedode和datanode记录的信息版本对应。
注意:删除是个很危险的动作,不能确认的情况下不能删除!!做好删除的文件等通通备份!!
Hadoop添加节点的方法
自己实际添加节点过程:
- 先在slave上配置好环境,包括ssh,jdk,相关config,lib,bin等的拷贝;
- 将新的datanode的host加到集群namenode及其他datanode中去;
- 将新的datanode的ip加到master的conf/slaves中;
- 重启cluster,在cluster中看到新的datanode节点;
- 运行bin/start-balancer.sh,这个会很耗时间