MAC M1大数据0-1成神篇-23 hdfs读数据流程

本文详细阐述了客户端如何通过Hadoop Distributed File System (DFS)读取文件的步骤,包括客户端请求、DFS检查文件信息、创建FSDataInputStream、按块读取并合并文件,直至关闭输入流的过程。
摘要由CSDN通过智能技术生成

写在前面:

进入主题:

  • 首先客户端发送请求到DFS,申请读取某一个文件
    • /tomcat.tar.gz
  • DFS去NN查找这个文件的信息(权限,文件是否存在)
    • 如果文件不存在,抛出指定的错误
    • 如果文件存在,返回成功状态
  • DFS创建FSDataInputStream对象,客户端通过这个对象读取数据
  • 客户端获取文件第一个Block信息,返回DN1 DN2 DN8
  • 客户端直接就近原则选择DN1对应的数据即可
  • 依次类推读取其他块的信息,直到最后一个块,将Block合并成一个文件
  • 关闭FSDataInputStream

完毕。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值