在hadoop集群搭建完成后,我们需要启动集群进行测试,在这之前需要在集群中namenode节点进行格式化,这里刚开始接触接触hadoop的同学经常踩坑,需注意:
仅在集群第一次启动时需要格式化,之后启动不需要;如果之后需要进行格式化,则一定要先停止 namenode 和 datanode 进程,并且要
删除所有机器的 data 和 logs 目录,然后再进行格式化。
这一条非常重要!!!
可用ps命令查看进程情况,使用sbin/stop-dfs.sh关闭hdfs,即停止namenode和datanode进程。
删除目录一般采用rm -r 目录名,这个命令针对的是非空目录