HDFS读数据流程

HDFS读数据流程

(1)客户端给NameNode发起文件下载请求

(2)NameNode进行两项检查(1.检查用户是否有权限下载2.检查文件是否存在)检查通过后进行读取节点的选择(要遵从节点距离近、负载均衡的两个准则),之后NameNode返回目标文件的元数据

(3)客户端根据拿到的block信息,并向DataNode1请求读取Block1

(4)Datanode将该节点上的切片信息传输给客户端。

(5)如果没有获取到所有的切片信息,再与距离最近其他切片副本所在的DataNode建立通信通道,请求读取下一个Block,获取该节点的切片。如此重复,直到获取到所有的切片信息。

(6)客户端拿到所有切片后,将切片组装为完整的文件。

(2)里面节点距离的计算:

节点距离:两个节点到达最近的共同父节点的距离之和

上图中:节点1与节点2之间的距离是x+y 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值