HDFS读写流程

最新推荐文章于 2024-01-26 18:23:49 发布

qq_44238187

最新推荐文章于 2024-01-26 18:23:49 发布

阅读量101

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44238187/article/details/102909446

版权

大数据专栏收录该内容

3 篇文章 0 订阅

订阅专栏

读:

客户端向NameNode发送RPC请求,确定文件块所在位置
NameNode会根据集群拓扑结构与客户端的距离和DataNode返回的心跳状态排序返回DataNode
client读取靠前的DataNode(如果客户端本身就是DataNode可以短路读取)
并行读取,若失败从新读取
读完列表的block后,若文件读写没有结束,客户端继续向NameNode请求DataNode地址获取block列表
返回后续block列表
最后关闭输入流,并将读来所有的block合并成一个完整的文件

写:

客户端与NameNode建立通信,请求上传,NameNode检查目标文件和父级目录是否存在
NameNode返回是否可以上传
客户端请求上传第一个block
NameNode检查元数据池,根据副本配置等返回可用DataNode信息如A B C
客户端请求与A建立连接,A接受请求后会调用B,B接受后会调用C,将整个管道(pipeline建立完成,在逐级返回到client)
客户端开始向A传递第一个packet,A收到后会传给B,B收到会传送给C,A每收到一个packet放入一个应答队列等待应答
关机写入流,并且请求第二个block块上传

https://blog.csdn.net/whdxjbw/article/details/81072207

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS读写流程

读:写:客户端与NameNode建立通信,请求上传,NameNode检查目标文件和父级目录是否存在NameNode返回是否可以上传客户端请求上传第一个blockNameNode检查元数据池,根据副本配置等返回可用DataNode信息如A B C客户端请求与A建立连接,A接受请求后会调用B,B接受后会调用C,将整个管道(pipeline建立完成,在逐级返回到client)客户端开始向...
复制链接

扫一扫

专栏目录

qq_44238187 CSDN认证博客专家 CSDN认证企业博客

码龄6年

5: 原创

122万+: 周排名

71万+: 总排名

1287: 访问

: 等级

52: 积分

2: 粉丝

0: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

分类专栏

大数据 3篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。