Federation的使用场景

最新推荐文章于 2023-03-16 16:06:07 发布

行路者-慢慢来

最新推荐文章于 2023-03-16 16:06:07 发布

阅读量1.1k

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28069577/article/details/90516278

版权

大数据专栏收录该内容

32 篇文章 1 订阅

订阅专栏

使用场景

HDFS运行时将元数据存储在NameNode内存中，记录了每个文件对象内容（名称、权限、属组等）。NameNode内存使用量和文件个数相关，NameNode的内存的限制将制约文件存储数量。过大内存同时会导致以下问题：

启动花费的时间太长。
Namenode在Full GC时，对外部应用的响应会产生延迟，如果发生错误将会导致整个集群不可用。
对于大JVM Heap进行调试比较困难，优化NameNode内存的性价比低。

Federation中每对NameNode分管一部分目录，使得一个集群可以扩展到更多NameNode节点，总体能够支持更多的文件存储。

随着业务的发展，集群规模接近2000台，NameNode响应的RPC QPS也在逐渐提高。越来越高并发的读写，与NameNode的粗粒度元数据锁，使NameNode RPC响应延迟和平均RPC队列长度也在慢慢提高。由于是单个NameNode的HDFS架构，因此整个HDFS文件系统的吞吐量受限于单个NameNode的吞吐量。

Federation中HDFS读写的时候，多对NameNode管理不同的数据，且同时对外提供服务，将为用户提供更高的读写吞吐率。

非Federation场景下，单对NameNode负载过高的应用，会影响到整个集群的服务能力。

采用Federation后，用户可根据需要将不同业务数据交由不同Namespace管理，这样不同业务之间影响很小。

集群的可用性

非Federation场景下，一对NameNode故障会导致整个Hadoop集群不可用

行路者-慢慢来

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Federation的使用场景

使用场景扩展性性能瓶颈隔离问题集群的可用性扩展性HDFS运行时将元数据存储在NameNode内存中，记录了每个文件对象内容（名称、权限、属组等）。NameNode内存使用量和文件个数相关，NameNode的内存的限制将制约文件存储数量。过大内存同时会导致以下问题：启动花费的时间太长。 Namenode在Full GC时，对外部应用的响应会产生延迟，如果发生错误...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。