聊聊HDFS和Ozone的融合

Android路上的人

于 2017-11-05 17:56:43 发布

阅读量5.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： HDFS Hadoop Ozone 文章标签： hdfs namespace ozone

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/androidlushangderen/article/details/78450332

本文探讨了如何将Ozone与HDFS整合，解决HDFS命名空间扩展性问题。Ozone通过Storage Container概念改进了块服务，减轻NameNode压力。Ozone FS作为文件系统接口，使数据能平滑迁移至Ozone，兼容现有HDFS路径，适用于Spark和Hive等应用。然而，将全内存namespace转为K-V存储可能导致查询效率下降，未来可能通过优化内存工作集来提升性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

Ozone的出现的初衷就是要解决HDFS namespace的扩展性问题，那么现在问题了，未来如何将这两大从设计上上来已经完全大改变的系统整合起来呢？这个听起来非常有意思，本文笔者结合最近社区的一些讨论，来简单聊聊这个话题。

Ozone的核心结构

社区在设计Ozone的时候，提出了一个具有关键性意义的概念：Storage Container。而不是HDFS中的块（block）概念。二者的关系是：Storage Container对外提供块服务。而Storage Container由底层存储向外提供服务，它可以支持不同的上层系统。所以Ozone的结构是这样的：

有人会说了，将block块服务剥离开来真的有这么重要吗？答案是非常重要。如果大家维护过拥有大规模数量级块的HDFS集群，一定经历过很多很多大大小小的问题。比如说以下几点：

大量的块导致NameNode维护的blockMap异常庞大，耗费内存。
每次涉及到块更新的操作都会持有一个全局锁，导致系统平均RPC的延时会提高，触发GC更频繁。
块规模的变大，在很多操作上会遇到瓶颈，快照，块汇报，等等。

而在Ozone中，SCM只负责维护这些Container信息。原先的block report就会变成container report。此时的关系变为：

KSM: object —> block
SCM: block —> container

在上图中，我们看到的是1对1的关系，在未来Ozone会支持到多对多的关系，类似与目前HDFS的Federation。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。