HDFS FoldedTreeSet的引入以及FBR优化处理

最新推荐文章于 2021-10-20 19:31:27 发布

Android路上的人

最新推荐文章于 2021-10-20 19:31:27 发布

阅读量2.1k

点赞数

分类专栏： HDFS Hadoop 文章标签： FBR HDFS FoldedTreeSet

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Androidlushangderen/article/details/80718899

版权

前言

在现有HDFS处理FBR（全量块汇报）逻辑中，处理开销是比较高的，尤其当集群中有大量块的时候。对此，社区在HDFS-9260中提出了一种新的树型结构来优化这块的处理。它本质上是一种排序好的Set集合，名为FoldedTreeSet。

FoldedTreeSet的作用

社区在实现FoldedTreeSet的时候，主要考虑到下面几点优化方向：

提升NN的FBR处理过程。
提高NN,DN中块数据信息的内存使用率，实质是新的结构比原来链表式的GSet会使用到更少的内存。
新的结构将会更利于GC处理。

首先第一点，NN的FBR处理可以借助于FoldedTreeSet的排序结果，进行更高效的处理，而且这个排序在NN和DN上都是可以排序好的。在原先老的处理过程中，因为块是未排序好的，针对每个块，需要检查NN上是否有这些块，然后还要跟踪这些块，在链表中做标记，然后区分出哪些块是没有被DN汇报上来的，整个过程非常的复杂。另一方面排序好的，Block，Replica信息查询起来也会更快。

FoldedTreeSet根据字面意思，是一个“折叠”了的TreeSet,因为在FoldedTreeSet里，每个Node包含了多个实体项，而不是传统中的一个。

FoldedTreeSet带来的隐患

FoldedTreeSet的实质是一个红黑树的实现，

最低0.47元/天解锁文章

Android路上的人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
HDFS FoldedTreeSet的引入以及FBR优化处理

前言在现有HDFS处理FBR（全量块汇报）逻辑中，处理开销是比较高的，尤其当集群中有大量块的时候。对此，社区在HDFS-9260中提出了一种新的树型结构来优化这块的处理。它本质上是一种排序好的Set集合，名为FoldedTreeSet。FoldedTreeSet的作用社区在实现FoldedTreeSet的时候，主要考虑到下面几点优化方向：提升NN的FBR处理过程。提高N...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。