大数据小白系列——HDFS(2)

kissknife

于 2019-01-07 12:13:36 发布

阅读量157

点赞数

分类专栏：大数据小白系列文章标签： hadoop hdfs ha

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kissknife/article/details/85994562

版权

大数据小白系列专栏收录该内容

5 篇文章 1 订阅

订阅专栏

这里是大数据小白系列，这是本系列的第二篇，介绍HDFS中SecondaryNameNode、单点失败（SPOF）、以及高可用（HA）等概念。

上一篇我们说到了大数据、分布式存储，以及HDFS中的一些基本概念，为了能更好的理解后续介绍的内容，这里先补充介绍一下NameNode到底是怎么存储元数据的。

首先，在启动的时候，将磁盘中的元数据文件读取到内存，后续所有变化将被直接写入内存，同时被写入一个叫Edit Log的磁盘文件。（如果你熟悉关系型数据库，这个Edit Log有点像Oracle Redo Log，这是题外话）。

Q: 为什么不把这些变化直接写到磁盘上的元数据中，使磁盘上的元数据保持最新呢？Edit Log是不是多此一举？

A: 这个主要是基于性能考虑，由于对EditLog的写是“顺序写”（追加），对元数据的写是“随机写”，两者在磁盘上表现出来的性能有相当大的差异。有兴趣的同学可以搜索学习一下磁盘相关原理哦。

上面这个方案，带来了一些明显的副作用。

1) NameNode长期运行，不停地向EditLog追加内容，导致它变得巨大无比。

2) NameNode在重启时，需要使用EditLog更新元数据文件，当Edit Log太大时，这一步骤就会耗费很长的时间。

为了消除这些副作用，HDFS中引入了另外一个角色，SecondaryNameNode。

它定期（比如每小时）从NameNode上抓取Edit Log，使用它更新元数据文件，并把最新的元数据文件写回到NameNode。

说完了SecondaryNameNode的职责之后，大家应该明白，它并不是一个“备用NameNode”，其实这是典型的命名不当，它应该被命名成“Checkpoint NameNode”才比较恰当。

接下来我们来说说HDFS中的单点失败问题（SPOF, Single Point Of Failure），即，当NameNode掉线之后，整个HDFS集群就变得不可用了。

为解决这个问题，实现系统的高可用性（HA, High Availability），Hadoop 2.0中真正引入了一个“备用NameNode”。

1) 对元数据的修改首先发生在NameNode，并被写入某个“共享位置”，备用NameNode将从该位置获取Edit Log。

2) DataNode节点们同时向两台NameNode汇报状态。

由于这两点，两台NameNode上的元数据将一直保持同步。这将保证当NameNode掉线后，用户可以立即切换到备用NameNode，系统将保持可用。

另外，由于备用NameNode比较空闲（不用处理用户请求），系统又给它安排了另外一份工作——定期使用Edit Log更新元数据文件，也就是说它接手了SecondaryNameNode的工作。

所以，在HA环境中，我们就不再需要SecondaryNameNode了。

今天就到这里，下一篇准备介绍JournalNode、NameNode选举等概念，Cheers!

喜欢本文的朋友们，欢迎长按下图关注订阅号程序员杂书馆，提前获得更多更新内容，更可获赠大数据纸质书籍。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据小白系列——HDFS(2)

这里是大数据小白系列，这是本系列的第二篇，介绍HDFS中SecondaryNameNode、单点失败（SPOF）、以及高可用（HA）等概念。上一篇我们说到了大数据、分布式存储，以及HDFS中的一些基本概念，为了能更好的理解后续介绍的内容，这里先补充介绍一下NameNode到底是怎么存储元数据的。首先，在启动的时候，将磁盘中的元数据文件读取到内存，后续所有变化将被直接写入内存，同时被写入...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。