HDFS 读取流程

先看图
在这里插入图片描述
在这里插入图片描述

通过物理距离返回排序列表

HDFS客户端要读取数据首先必须和nameNode 建立连接,获取dataNode信息。
nameNode会根据客户端的物理地址返回一个由近到远的块地址列表。
客户端拿到列表后和最近的进行连接读取数据

注意点

HDFS中块是由一个完整的文件分成多个块,而每个块可能保存在不同机架上。
每个块中除了数据还保存了所在文件的偏移量。
所以读取到不同的块后可以再组成一个完整的文件。

数据可靠性

如何判断块是可靠的?
每个块都由一个通过计算得到的code,这是在写入的时候就计算好的。读取后根据这个块还会计算一遍,如果2者相同则表示可靠,否则表示异常。
客户端会再去其他dataNode中读取一遍

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值