HDFS特性

最新推荐文章于 2024-06-07 12:43:01 发布

铁人史大颗

最新推荐文章于 2024-06-07 12:43:01 发布

阅读量894

点赞数

分类专栏：大数据分布式存储文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xingyunyang/article/details/126279719

版权

大数据分布式存储专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.适合存放大文件，不适合小文件

每个文件被写入HDFS的时候，都会生成元数据，元数据是保存在NameNode里面的。HDFS在工作状态下，元数据是被加载在内存当中的。

由于元数据信息属于描述性信息，比如文件名，文件大小，block块的存放位置等等，所以每条元数据信息的大小是150个字节。也就是说，写一个1T的大文件和写一个1M的小文件，所产生的元数据的大小都是150个字节

综上所述，在NameNode内存有限的情况下，存大文件显然更划算，因此HDFS适合存放大文件。

这其实还引申了另一个问题，就是一个NameNode所能管理的文件大小是有限的，因为内存是有上限的。所以才会有NameNode的联邦机制，即一个NameNode管理不了时，就再加一个NameNode。但是这样运维压力会很大，所以现在会有一些替代方案，比如cubefs,juicefs。

2.HDFS不适合低延时场景

HDFS在设计上是做批数据处理的，更多的是保障吞吐量，而且HDFS写入过程很复杂，要经过大量的网络传输，因此会牺牲数据请求时的时间。

3.基于流的数据访问模式

HDFS是基于流的数据访问模式，这种模式的特征是一次写入，多次读取，不支持随机修改，只能在文件尾部追加写。

铁人史大颗

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS特性

HDFS特性分析
复制链接

扫一扫

专栏目录

铁人史大颗

博客等级

码龄3年

14
原创

84
点赞

145
收藏

75
粉丝

关注

私信

热门文章

分类专栏

最新评论

2024年5月最新OpenAI绑卡教程
CSDN-Ada助手: 恭喜您发布了第12篇博客！看到“2024年最新OpenAI绑卡教程”这个标题，让我对未来的科技发展充满了期待。希望您能继续分享关于人工智能领域的知识和经验，为读者们带来更多的启发和帮助。或许下一步可以探讨一些实际案例或者深度分析，让读者更好地理解和运用OpenAI技术。期待您的更多精彩内容！祝您创作顺利！
kubebuilder实战之打包部署
Kearney form An idea: 镜像打包时没有把密钥拷贝进去，那镜像包里没有密钥代码跑不起来哎
用好scratch，打包docker最小镜像
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
用好scratch，打包docker最小镜像
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。