NameNode故障处理
NameNode故障后,可以采用如下两种方法恢复数据。
方法一:
模拟NameNode停止并丢失元数据
将SecondaryNameNode中数据拷贝到NameNode存储数据的目录;
》1 kill -9 NameNode进程ID
》2 删除NameNode存储的数据(/opt/module/hadoop-2.7.2/data/tmp/dfs/name)
rm -rf /opt/module/hadoop-2.7.2/data/tmp/dfs/name/*
从2NN复制元数据到NN并重启
》3 拷贝SecondaryNameNode中数据到原NameNode存储数据目录
cd /opt/module/hadoop-2.7.2/data/tmp/dfs
scp -r dev1@hadoop104:/opt/module/hadoop-2.7.2/data/tmp/dfs/namesecondary/* ./name/
》4 重新启动NameNode
hadoop-daemon.sh start namenode
方法二:
使用-importCheckpoint
选项启动NameNode守护进程,从而将SecondaryNameNode中数据拷贝到NameNode目录中。
模拟NameNode停止并丢失元数据
》1 kill -9 NameNode进程
》2 删除NameNode存储的数据(/opt/module/hadoop-2.7.2/data/tmp/dfs/name)
rm -rf /opt/module/hadoop-2.7.2/data/tmp/dfs/name/*
从2NN复制namesecondary文件夹
》3 如果SecondaryNameNode不和NameNode在一个主机节点上,
需要将SecondaryNameNode存储数据的目录拷贝到NameNode存储数据的平级目录,并删除in_use.lock文件
cd /opt/module/hadoop-2.7.2/data/tmp/dfs
scp -r dev1@hadoop104:/opt/module/hadoop-2.7.2/data/tmp/dfs/namesecondary ./
pwd
/opt/module/hadoop-2.7.2/data/tmp/dfs
ls
data name namesecondary
rm -rf ./namesecondary/in_use.lock
调用importCheckpoint恢复
》4.修改hdfs-site.xml中的
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/module/hadoop-2.7.2/data/tmp/dfs/name</value>
</property>
》5 导入检查点数据(等待一会ctrl+c结束掉)
hdfs namenode -importCheckpoint
本质做了两件事 (1)恢复了namenode的元数据 (2)启动了NameNode 如果使用Ctrl+C,那么会停止importCheckpoint与关闭NameNode
》6 启动NameNode
hadoop-daemon.sh start namenode