记录一次小小的namenode挂掉

最新推荐文章于 2023-07-23 21:41:04 发布

程序员惜时

最新推荐文章于 2023-07-23 21:41:04 发布

阅读量842

点赞数 3

分类专栏： Hadoop linux Windows10

本文链接：https://blog.csdn.net/qq_44028464/article/details/103328640

版权

Hadoop 同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

linux

6 篇文章 1 订阅

订阅专栏

Windows10

4 篇文章 0 订阅

订阅专栏

为了演示SecondaryNameNode是如何恢复namenode的

第一步当然是直接用法kill -9 NameNode进程号意外结束namenode进程

在这里插入图片描述

第二步. 进入namenode里面的/home/whzy/hadoopdata/dfs/name

这个目录 rm -rf name/* 删除name里面所有数据表示namenode数据丢失
在这里插入图片描述

第三步进入salve1主机(里面配置了secondarynamenode) 进入

ome/whzy/hadoopdata/dfs/namesecondary 这个目录将其下的current目录通过scp命令远程拷贝到master的name目录

在这里插入图片描述

第四步启动master 里面的 namenode

hadoop-daemon.sh start namenode

启动单进程 jps之后正常启动
在这里插入图片描述

第五步检测

进入 master:50070 显示正常

在这里插入图片描述
上传in_use.lock 这个文件到hdfs 里面的/whzyB102/in_use.lock

目录下显示上传成功
在这里插入图片描述

自此 namenode正常 Hadoop集群正常

使用-importCheckpoint命令恢复namenode

先修改配置文件

 vi hdfs-site.xml

将这些配置添加到文件末尾
意思是修改检查时间从之前的3600秒（一小时）到现在的1分钟
将namenode 这个name的目录修改成namenode的目录

<property>
  <name>dfs.namenode.checkpoint.period</name>
  <value>60</value>
  <description>The number of seconds between two periodic checkpoints.
  </description>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
  <value>/home/whzy/hadoopdata/dfs/name</value>
</property>

继续一次删除namenode 进程

kill -9 31291 删除namenode进程

在这里插入图片描述

rm -rf name/* 删除NameNode存储的数据

在这里插入图片描述

如果 SecondaryNameNode 不和 NameNode 在一个主机节点上，需要将 SecondaryNameNode 存储数据的目录拷贝到 NameNode 存储数据的平级目录，并删除 in_use.lock 文件

在这里插入图片描述
删除拷贝过来的in_use.lock文件

执行importCheckpoint命令

在这里插入图片描述
在执行命令的时候重新建立一个连接看到显示的namenode命令
其实就是命令进行时生成的一个namenode守护进程命令结束之后namenode守护进程消失

在这里插入图片描述
等觉得命令运行的差不多了将命令ctrl+C 结束掉
之后执行上传文件命令文件上传成功namenode生效

总结

第一个方法在工作的时候用的比较多
其实更多的是用的HA 高可用一个namenode进程挂掉之后直接换上第二个namnode进程就行

程序员惜时

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
记录一次小小的namenode挂掉

为了演示SecondaryNameNode是如何恢复namenode的第一步当然是直接用法kill -9 NameNode进程号意外结束namenode进程第二步. 进入namenode里面的/home/whzy/hadoopdata/dfs/name这个目录 rm -rf name/* 删除name里面所有数据表示namenode数据丢失第三步进入salve1主机(里面配置了s...
复制链接

扫一扫