HDFS Client Read流程分析【链接及图解】

1.

推荐博客:

  1. HDFS read解析(一)之Open文件流
  2. HDFS read解析2之从文件流中read

  • 打开文件
  • 读操作

打开文件

当客户端读取一个HDFS文件时,首先会调用DistributedFileSystem.open()方法打开这个文件,open方法首先会调用DFSCklient.open()方法创建HDFS文件对应的DFSInputStream输入流对象,然后构建一个HDFSDataInputSream对象包装DFSInputStream,最后将这个HDFSDataInputStream对象返回给客户端代码。

open()操作调用了两个RPC方法,分别是

  • ClientProtocol.getBlockLocations()方法, 用于获取文件对应的所有数据块的位置信息;
  • CientDatanodeProtocol.getReplicaVisibleLength()方法,用于获取Datanode上存储的某个数据块的真实长度。
client  ---->  DistributeFileSystem.open()    
                                   |
                         DFSClient.open()
                           /      RPC    \
        ①向NN getBlockLocations()      ②向DN获得真实长度
                                  \/
                            得到DFSInputStream      

两个RPC

  1. ClientProtocol.getBlockLocations()
    获得指定路径的所有
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值