Secondary NameNode的作用
Secondary NameNode并不是NameNode的热备份,所以,当NameNode挂掉之后,它并不能替代NameNode工作,对外提供服务。
它的作用主要是:辅助NameNode,帮助NameNode对镜像文件和操作日志进行合并;在NameNode数据缺失的时候可以帮助NameNode恢复部分的数据(至于为什么不能恢复全部的数据,后面会有解释)
具体工作机制
- Secondary NameNode向NameNode发出请求,看NameNode是否需要进行checkpoint活动。
- NameNode返回自己是否需要checkpoint活动的结果,若需要则继续,若不需要就没有后面的了。
- Secondary NameNode在接受到NameNode需要进行checkpoint 的请求之后,Secondary NameNode会向NameNode发起checkpoint请求。
- NameNode接收到请求后,NameNode对edits日志进行回滚。
- 将编辑日志edits和镜像文件fsimage拷贝到SecondaryName Node中。
- Secondary NameNode将NameNode拷贝过来的fsimage和edits加载到内存中。
- Secondary NameNode将内存中的fsimage和edits合并,生成新的fsimage.ckkpoint。
- Secondary NameNode集那个fsimage.chkpoint拷贝到NameNode中。
- NameNode将fsimage.chkpoint重新命名为fsimage;
为什么只能恢复一部分的数据
当Secondary NameNode接收到NameNode的编辑日志edits和镜像文件image之后,NameNode之中的操作还会记录到NameNode的编辑日志edits中,不会同步到Secondary NameNode,所以,如果NameNode将checkpoint之后的数据丢失之后,Secondary NameNode只有checkpoint之前的数据,所以,只能恢复部分的数据,对于checkpoint之后的数据无法恢复。
既然无法恢复全部数据,则需要使用NameNode HA模式来保证NameNode数据存储的安全,NameNode HA模式的相关将在后续更新
欢迎各位指正交流
文章内容为作者学习过程中,查阅资料的自己总结,若有不当之处,还请联系作者改正,敬请不吝赐教