HDFS读写流程

最新推荐文章于 2023-08-08 11:19:29 发布

健鑫.

最新推荐文章于 2023-08-08 11:19:29 发布

阅读量603

点赞数 1

分类专栏： Hadoop 文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62759952/article/details/128104228

版权

Hadoop 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

HDFS读写流程

HDFS写流程

client发起文件上传请求，通过RPC（远程调用，跨服务器，需要网络编程实现）与NameNode建立通信。NameNode检查该用户是否有上传的权限，该文件是否在对应的目录下有重名文件，有一个不符合要求则报错
client对文件进行切分，默认128一个block，切分完毕后，client请求第一个block该传输到哪个DataNode上。
NameNode根据网络拓朴、机架感知、副本机制对文件机型分配，返回可用的DataNode地址
client对返回一个DataNode A进行通信，本质是进行RPC调用，建立pipeline，A收到请求之后继续调用B，B再调用C，整个pipeline完成之后，逐级返回client
client开始向A发送第一个block(先从磁盘中读取数据然后放到本地缓存)，以packet（默认64kb）为单位，A收到一个packet发送给B，B发送给C，A每传完一个packet就会放入一个应答队列等待应答，每个packet传输玩，反方向会逐个发送ack（命令正确应答）
一个block传输完成之后，client会再次请求NameNode上传第二个block

HDFS读流程

client向NameNode发送RPC请求，请求文件block的地址，NameNode通过查询元数据，找到文件块所在的DataNode地址
挑选一台DataNode（就近，然后随机），请求读取数据
DataNode传输数据给client（从磁盘读取数据输入流，以packet为单位校验）
客户端以packet为单位接受，先在本地缓存，再写入目标文件
读取时并行读取block文件，不是一块一块读取

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

健鑫. CSDN认证博客专家 CSDN认证企业博客

码龄3年

94: 原创

73万+: 周排名

8万+: 总排名

8万+: 访问

: 等级

1271: 积分

253: 粉丝

257: 获赞

87: 评论

347: 收藏

私信

关注

热门文章

分类专栏

个人经历
GFS论文解读 1篇
java并发编程 1篇
数据仓库 4篇
大数据组件 2篇
数据结构与算法 11篇
hive 9篇
Hadoop 12篇
java多线程 8篇
spark 16篇
kafka 5篇
scala 4篇
JVM 2篇
JAVA 11篇

最新评论

三分钟快速理解Flink 作业提交流程(包工头的工程之路)
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
三分钟快速理解Flink 作业提交流程(包工头的工程之路)
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Superset的安装(亲测三遍，有效)
JasonWod: 引用「pip install dataclasses」为啥我装出来dataclasses是0.6的？
java并发-线程池
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615582852?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
java并发-线程池
勾栏听曲_0: 非常细致的内容，支持

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

健鑫. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。