hadoop之HDFS HA高可用---HDFS Federation架构设计

最新推荐文章于 2023-01-23 23:11:36 发布

小刘同学-很乖

最新推荐文章于 2023-01-23 23:11:36 发布

阅读量228

点赞数

分类专栏： # HDFS 文章标签： hadoop hdfs 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012387141/article/details/105121271

版权

HDFS 专栏收录该内容

21 篇文章 0 订阅

订阅专栏

NameNode架构的局限性

Namespace（命名空间）的限制
由于NameNode在内存中存储所有的元数据（metadata），因此单个NameNode所能存储的对象（文件+块）数目受到NameNode所在JVM的heap size的限制。50G的heap能够存储20亿（200million）个对象，这20亿个对象支持4000个DataNode，12PB的存储（假设文件平均大小为40MB）。随着数据的飞速增长，存储的需求也随之增长。单个DataNode从4T增长到36T，集群的尺寸增长到8000个DataNode。存储的需求从12PB增长到大于100PB。
隔离问题
由于HDFS仅有一个NameNode，无法隔离各个程序，因此HDFS上的一个实验程序就很有可能影响整个HDFS上运行的程序
性能的瓶颈
由于是单个NameNode的HDFS架构，因此整个HDFS文件系统的吞吐量受限于单个NameNode的吞吐量

HDFS Federation架构设计

能不能有多个NameNode

NameNode	NameNode	NameNode
元数据	元数据	元数据
Log	machine	电商数据/话单数据

HDFS Federation应用思考

不同应用可以使用不同NameNode进行数据管理
图片业务、爬虫业务、日志审计业务
Hadoop生态系统中，不同的框架使用不同的NameNode进行管理NameSpace。（隔离性）

关注微信公众号
简书：https://www.jianshu.com/u/0278602aea1d
CSDN：https://blog.csdn.net/u012387141

小刘同学-很乖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop之HDFS HA高可用---HDFS Federation架构设计

NameNode架构的局限性Namespace（命名空间）的限制由于NameNode在内存中存储所有的元数据（metadata），因此单个NameNode所能存储的对象（文件+块）数目受到NameNode所在JVM的heap size的限制。50G的heap能够存储20亿（200million）个对象，这20亿个对象支持4000个DataNode，12PB的存储（假设文件平均大小为40MB）...
复制链接

扫一扫

专栏目录

小刘同学-很乖 CSDN认证博客专家 CSDN认证企业博客

码龄11年

204: 原创

2万+: 周排名

3万+: 总排名

18万+: 访问

: 等级

2999: 积分

2677: 粉丝

186: 获赞

84: 评论

426: 收藏

私信

关注

热门文章

分类专栏

mysql 3篇
Elasticsearch 7篇
mongodb 1篇
linux 3篇
RabbitMQ 10篇
docker 1篇
maven 1篇
nginx
Spark 5篇
SparkCore 13篇
SparkSql 8篇
Spark Streaming 4篇
Spark内核调优 12篇
hadoop入门及安装 14篇
HDFS 21篇
MapReduce 19篇
zookeeper 7篇
Hive 24篇
Flume 7篇
Kafka 7篇
HBase 10篇
Sqoop 3篇
Oozie 2篇
Azkaban 3篇
git 1篇
oracle 1篇
tron 6篇
PHP学习笔记 7篇

最新评论

SparkSQL实战案例
2301_76270529: 笔者这个数据量大的时候，不采取分区处理吗?•mappattiton 函数可以分区处理数据
JPS-Java进程状态工具
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
Flume自定义Sink详细操作
qq_40706031: 打印的前缀和后缀不是分别为liujh:和:liujh吗，那打印结果不应该是liujh:hello:liujh 和liujh:liujh:liujh吗。。这个结果展示是截尚硅谷的吧= =
TRC20 解析数据等功能重点代码公布
普通网友: 感觉还行啊，就是生成钱包的接口直接用离线生成的方法
trc20部署event-plugin
weixin_42519407: 大神,启动节点的命令后面这个--es 是做什么的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。