HDFS Federation

最新推荐文章于 2022-11-28 11:17:34 发布

GeekStuff

最新推荐文章于 2022-11-28 11:17:34 发布

阅读量1.5k

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aspirinvagrant/article/details/9040041

版权

Hadoop 专栏收录该内容

19 篇文章 1 订阅

订阅专栏

单个NameNode的架构使得HDFS在集群扩展性和性能上都有潜在的问题，当集群大到一定程度后，NameNode进程使用内存就回显得力不从心。而且，所有的元数据信息的读取和操作都需要与NameNode进行通信，如客户端的addBlock、getBlockLocations，还有DataNode的blockRecieved、sendHeartbeat、blockReport等操作。在集群规模变大后，NameNode成为了性能的瓶颈。
令人兴奋的是， Hadoop 2.0里的HDFS Federation是上述问题迎刃而解。下面将重点介绍HDFS Federation。

利用共享存储来在两个NameNode间同步edits信息。以前的HDFS是share nothing but NameNode，现在NameNode又share storage，这样其实是转移了单点故障的位置，但中高端的存储设备内部都有各种RAID以及冗余硬件包括电源以及网卡等，比服务器的可靠性还是略有提高。通过NameNode内部每次元数据变动后的flush操作，加上NFS的close-to-open，数据的一致性得到了保证。

用于监视和控制NameNode进程的FailoverController进程显然，我们不能在NameNode进程内进行心跳等信息同步，最简单的原因，一次FullGC就可以让NameNode挂起十几分钟。目前版本里是用ZooKeeper来做同步锁。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS Federation

单个NameNode的架构使得HDFS在集群扩展性和性能上都有潜在的问题，当集群大到一定程度后，NameNode进程使用内存就回显得力不从心。而且，所有的元数据信息的读取和操作都需要与NameNode进行通信，如客户端的addBlock、getBlockLocations，还有DataNode的blockRecieved、sendHeartbeat、blockReport等操作。在集群规模变大后，
复制链接

扫一扫

专栏目录

GeekStuff CSDN认证博客专家 CSDN认证企业博客

码龄13年

142: 原创

13万+: 周排名

83万+: 总排名

75万+: 访问

: 等级

7005: 积分

288: 粉丝

281: 获赞

100: 评论

904: 收藏

私信

关注

热门文章

分类专栏

MLDM 38篇
Spark 5篇
Hadoop 19篇
Java 17篇
Scala 9篇
Storage 9篇
C/C++ 8篇
Database 5篇
Algorithm 40篇
Reflection 4篇
Graph 8篇
OS 25篇
R 8篇
Skill 4篇

最新评论

词的分布表示
孝钦显皇后给过版权费了: 一个神经概率语言模型
词的分布表示
Hi,Mr.Blue: 确实如此。挺多错的文章……
置信度传播算法（Belief Propagation）
卷不动了，我回寝吧: 兄弟，那个mrf的图是不是画错了，灰色应该换成黑色，黑色是显示节点xi
置信度传播算法（Belief Propagation）
Big Bear 12: 多谢楼主分享，
社区划分的标准--模块度
fatdogssss: 66666666666666666666666666666666666666666666666666666666666666

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。