格式化步骤 :
-
先jps查看当前是否有hadoop相应的进程
如果有则关闭相应的进程 ,如果还有残留进程 则用 kill -9 端口号 杀死进程
原因: 如果在开启进程的时候去上出data和logs文件夹,因为进程仍然在运 行还是会产生相应的data和logs文件,所有并不能删除相应的记录 -
结束相关的进程后,在hadoop的目录下删除data和logs文件夹
原因 格式化namenode时只会格式化hadoop目录下data/tmp/name文件夹内容,并不会格式化整个data文件夹,因为data问件夹还有data/tmp/data存储的datanode的内容 ,如果此时启动集群,此namenode和datanode不在同一个集群,集群id也不一样,通过查看hadoop目录下
vim data/tmp/dfs/name/curren/VERSION (namenode信息)
vim data/tmp/dfs/data/curren/VERSION (datanode信息)
查看这两个文件的clusterID不一致
删除相应文件data 和logs
rm -rf data/ logs/
格式化namenode
命令:bin/hdfs namenode format
然后再重启集群
常见问题:
1.重启namenode后无法重启datanode
2.重启namenod后发现能启动 然后启动datanode也启动 然后发现namenode进程没有了
查看VERSION里面的clusterID是否一致
一般是由于非正确格式化namenode引起,比如为正常删除相应的data和logs文件 ,或者未在结束进程情况下格式化namenode