HDFS的基本原理

最新推荐文章于 2024-03-21 12:17:27 发布

zzh1233455

最新推荐文章于 2024-03-21 12:17:27 发布

阅读量250

点赞数

分类专栏：大数据文章标签： hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzh1233455/article/details/110069300

版权

大数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HDFS的设计目的：HDFS（Hadoop Distributed File System ）是Hadoop分布式文件系统，设计目的是为了存储超大文件，主要是针对几百MB，GB，甚至TB的文件，流式读取方式，主要是针对一次写入，写入的过程使用的是append的方式，多次读出的使用模式。
该分布式系统构建在普通PC机组成的集群上，大大降低了构建成本，并屏蔽了系统故障，保存多个副本，且提供容错机制，副本丢失或宕机自动恢复（默认存3份），使得用户可以专注于自身的操作运算。
HDFS由一个Namenode. 一个Secondary Namenode 若干Datanodes和Client组成并且采用主从结构存储的基本单位是块
Namenode相当于书的目录
NameNode不存储实际的文件数据，实际数据是存储在DataNode中，他存储的是文件分块的基础数据；能通过文件获取文件的快列表及其分布在哪些dataNode上。
NameNode并不会将文件的分块数据持久化存储，这些信息会在HDFS启动时由各个dataNode上报过来。他把这些数据存入内存中。并且会定时对内存中的数据进行快照。所以对于NameNode节点的机器内存应该大一些。
Datenode相当于书的正文
一章是一个文件一节是一个块目录成为元数据目录指名的各章节页码成为映射用户访问数据首先访问Namenode
HDFS采用块抽象概念的好处：支持大规模文件存储简化系统设计适合数据备份。
一个块为64～128MB

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zzh1233455 CSDN认证博客专家 CSDN认证企业博客

码龄4年

8: 原创

173万+: 周排名

14万+: 总排名

7448: 访问

: 等级

90: 积分

4: 粉丝

7: 获赞

6: 评论

8: 收藏

私信

关注

热门文章

分类专栏

大数据 1篇
1 1篇

最新评论

vue tag在实现父容器超出隐藏
CSDN-Ada助手: 不知道 Vue入门技能树是否可以帮到你：https://edu.csdn.net/skill/vue?utm_source=AI_act_vue
若依框架解决多个项目同时启动token重复问题
FAlienDug: nice，效果明显
若依框架解决多个项目同时启动token重复问题
w_z_y_123: 感谢,非常实用
VUE实现div拖动
CSDN-Ada助手: 恭喜您写了第7篇博客！标题看起来很有趣，我很期待阅读您的内容。对于VUE实现div拖动这个主题，我觉得这是一个很实用的功能。希望您能够详细介绍VUE是如何实现这个功能的，并且给出一些实际应用的例子。同时，也希望您能够分享一些在实现这个功能过程中的心得和经验。期待您的下一篇博客，加油！
Vue中WebSocket链接中断、心跳机制防止自动断开
CSDN-Ada助手: 恭喜您写出了这篇关于Vue中WebSocket链接中断和心跳机制的博客，让读者更深入了解这个领域。接下来，我建议您可以在这篇博客的基础上，进一步扩展WebSocket的应用场景，或者探讨其他前端技术的相关话题。期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。