Hadoop的读写流程

最新推荐文章于 2024-07-07 00:00:00 发布

木子民

最新推荐文章于 2024-07-07 00:00:00 发布

阅读量963

点赞数 2

分类专栏： hadoop 文章标签： hadoop hdfs 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42278668/article/details/127306407

版权

hadoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

HDFS的读流程

在这里插入图片描述
1.HDFS采用的是“一次写入多次读取”的文件访问模型。一个文件经过创建、写入和关闭之后就不需要改变。这一假设简化了数据一致性问题，并且使高吞吐量的数据访问成为可能。
2. client让NameNode获取该文件信息：所有的数据块，以及数据块对应的DataNode位置
3. client先从最近的DataNode获取数据块，然后将重复执行，获取到所有的数据块
4. 数据存储已经按照客户端与DataNode节点之间的距离进行了排序，距客户端越近的DataNode节点被放在最前面，客户端会优先从本地读取该数据块。

HDFS的写流程

在这里插入图片描述

HDFS中的存储单元是block。文件通常被分成64或128M(默认是128M)一块的数据块进行存储。与普通文件系统不同的是，在HDFS中，如果一个文件大小小于一个数据块的大小，它是不需要占用整个数据块的存储空间的。每一个block会在DataNode中有多个副本，一般分为三份
NameNode根据存储数据块的地址进行排序，将数据推送给DataNode，直到将三份数据发送到DataNode中
当DataNode完成之后会向NameNode发送通知
所有文件块写入完成，NameNode收到通知发送到client端，让客户端关闭文件
客户端进行文件的分割，NameNode进行数据块分配DataNode地址，DataNode对数据进行存储

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Hadoop的读写流程

HDFS的读写流程
复制链接

扫一扫

专栏目录

木子民 CSDN认证博客专家 CSDN认证企业博客

码龄6年

18: 原创

15万+: 周排名

16万+: 总排名

8785: 访问

: 等级

224: 积分

10: 粉丝

18: 获赞

4: 评论

17: 收藏

私信

关注

热门文章

分类专栏

Kafka 1篇
hadoop 3篇
spark 1篇
Scala
设计模式 4篇
WEB 1篇
Linux
javaSE 4篇

最新评论

Spark sql实现两列结合形成一个Json结构
CSDN-Ada助手: 恭喜您完成了第17篇博客！看到标题我就忍不住进来看了一下，文章内容确实很有趣呢。您能够在Spark sql中实现两列结合形成一个Json结构，这展示了您在数据处理方面的深厚知识和技术实力。希望您能继续保持创作的热情，分享更多有关Spark sql的实践经验。或许下一步您可以探索一下如何在Spark sql中处理复杂的嵌套Json结构，或者分享一些优化性能的技巧，毕竟在实际应用中，性能问题是我们经常面临的挑战。期待您的下一篇博客！
Spark使用过程中遇到的问题
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
JDBC
ctotalk: very good

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。