了解Hadoop的同学都知道,Hadoop有两个核心的组成部分,一个是HDFS,另一个则是MapReduce,HDFS作为Hadoop的数据存储方案,MapReduce则提供计算服务;同时,HDFS作为一种分布式文件系统,它的安装也是需要相应的格式化操作的,如果安装失败或者我们需要重新安装的时候,那我们就需要对HDFS重新进行格式化,这篇文章就和大家一起讨论下如何进行HDFS的重新格式化。
重新格式化hdfs系统的方法:
1.把配置文件修改正确
2.停止hdfs服务(使用jps命令查看是否有 nameNode,dataNode,secondary nameNode三个进程)
进入 sbin目录中 执行
sh stop-dfs.sh
如果使用jps 查看还有这三个进程中有一个进程没有关闭,那使用kill -9 进程号 去关闭进程
3、查看hdfs-site.xml配置的路径
我们打开Hadoop的hdfs-site.xml,基本配置如下所示:
<property>
<name>dfs.name.dir</name>
<value>file:///data/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>file:///data/hadoop/hdfs/name</value>
</property>
将 dfs.name.dir所指定的目录文件夹删除、dfs.data.dir所指定的目录文件夹在系统中删除(不要修改配置文件!)
4、删除core-site.xml配置文件指定的相关目录,主要不要修改配置文件!!
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.6.4/tmp</value>
</property>
将hadoop.tmp.dir所指定的目录在系统中删除(不要修改配置文件!)。
5.不要忘记重新新建/tmp文件夹
6、重新执行命令:hdfs namenode -format
格式化完毕。
这种格式化HDFS的方式是需要把原来HDFS中的数据全部清空,然后再格式化并安装一个全新的HDFS。
注:这种格式化方式需要将HDFS中的数据全部清空,以后我们探讨不需删除数据即可重新格式化的方法。