Hadoop的读写流程

HDFS的读流程

在这里插入图片描述
1.HDFS采用的是“一次写入多次读取”的文件访问模型。一个文件经过创建、写入和关闭之后就不需要改变。这一假设简化了数据一致性问题,并且使高吞吐量的数据访问成为可能。
2. client让NameNode获取该文件信息:所有的数据块,以及数据块对应的DataNode位置
3. client先从最近的DataNode获取数据块,然后将重复执行,获取到所有的数据块
4. 数据存储已经按照客户端与DataNode节点之间的距离进行了排序,距客户端越近的DataNode节点被放在最前面,客户端会优先从本地读取该数据块。

HDFS的写流程

在这里插入图片描述

  1. HDFS中的存储单元是block。文件通常被分成64或128M(默认是128M)一块的数据块进行存储。与普通文件系统不同的是,在HDFS中,如果一个文件大小小于一个数据块的大小,它是不需要占用整个数据块的存储空间的。每一个block会在DataNode中有多个副本,一般分为三份
  2. NameNode根据存储数据块的地址进行排序,将数据推送给DataNode,直到将三份数据发送到DataNode中
  3. 当DataNode完成之后会向NameNode发送通知
  4. 所有文件块写入完成,NameNode收到通知发送到client端,让客户端关闭文件
  5. 客户端进行文件的分割,NameNode进行数据块分配DataNode地址,DataNode对数据进行存储
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值