如何重新格式化Hadoop文件系统

大家知道Hadoop不能直接进行多次格式化,多次格式化($ hdfs namenode -format)会造成没有datanode,每次格式化后,namenode节点的clusterID(集群ID)会被新建,而datanode节点的clusterID还是原来的,造成namenode节点和datanode节点的clusterID(集群ID)不一致。那么应该怎样正确地重新格式化我们的Hadoop呢?

以下是正确重新格式化的方法:

a. 停止Hadoop所有进程

$ stop-all.sh

b.删除$HADOOP_HOME目录下的logs和tmp目录(关键步骤)

$ cd $HADOOP_HOME
$ ls
bin  include  libexec      logs        README.txt  share
etc  lib      LICENSE.txt  NOTICE.txt  sbin        tmp
$ rm -rf logs tmp

c.重新格式化文件系统

$ hdfs namenode -format

d.启动Hadoop进程

$ start-all.sh

e.确认Hadoop进程是否已开启

$ jps
7366 NameNode
8278 Jps
7640 SecondaryNameNode
7849 ResourceManager
7482 DataNode
7967 NodeManager

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值