HDFS的读取数据流程

最新推荐文章于 2023-09-06 23:11:05 发布

今夜落花听雨凉

最新推荐文章于 2023-09-06 23:11:05 发布

阅读量572

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CD523/article/details/111085319

版权

1. 发送请求，连接namenode，执行读取数据

2. namenode接受读取请求后，
首先判断当前这个操作用户是否拥有读取权限，如果不具有直接报错。
如果有读取权限，接着判断要读取的目录下是否存在这个文件，如果不存在，报错，如果存在，则根据机架感应原理，网络拓扑关系，副本机制，返回部分或者全部的block所在的datnode地址

3.当接受部分或全部的block列表后，然后进行并连接datanode节点，开始读取数据

4.当这些地址中的block全部读取完之后，如果之前请求的时部分的block，此时会再次请求namenode。

将剩余或者部分的block的datanode列表返回来，接着运行第三步。

开启读取数据，知道将所有的block读取完成

5，按照block排序，将读取的block一个一个连接起来，形成最终的文件，此时用户就能看到最终的文件了。

今夜落花听雨凉

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。