hadoop 学习笔记之3-hdfs读写流程

一、hdfs读文件流程

    

1)、hdfs client调用FileSystem.open(),DistributedFileSystem通过RPC与Namenode通信,NN返回该文件的部分或全部block列表,选取离客户端最优位置DataNode;

2)、FSDataInputStream,读取block信息,当读到block结尾的时候,FSDataInputStream关闭与NN的连接,继续读取下一个最优的block信息,每读完一个block都会进行checksum验证,如果读取出现异常,通知NN,会从其他副本中读取该block,如果block列表读完后,文件未结算会继续从NN读取下一批block列表,最后完成后关闭FSDataInputStream。

二、HDFS文件写入流程


1、hdfs client调用FileSystem.open(),DistributedFileSystem通过RPC与Namenode通信,在NN的namespace里创建一个新的文件但并不关联任何块,NN检查文件是否存在,操作权限,如果通过NN记录新文件信息,并在某个DN上创建数据块,返回FSDataOutputStream,将client引致数据块写入数据;

2、client调用write()方法,通过FSDataOutputStream流将数据首先写入第一个节点,第一个节点将数据传给第二个,第二个传给第三个。HDFS默认是每个block放置3份;

3、client 调用close方法,flush缓存区的数据包,block完成复制后,NN返回成功信息。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值