HDFS读写流程&NameNode工作机制

最新推荐文章于 2022-03-21 08:13:23 发布

FinalALong

最新推荐文章于 2022-03-21 08:13:23 发布

阅读量614

点赞数 1

分类专栏：大数据学习文章标签： HDFS读流程 HDFS写流程 NameNode 工作机制

本文链接：https://blog.csdn.net/weixin_42632961/article/details/83097741

版权

2 篇文章 0 订阅

订阅专栏

在这里插入图片描述

在这里插入图片描述

对namenode通信请求上传文件，namenode检查目标文件是否已存在，父目录是否存在，创建者是否有权限进行操作，成功则会为文件创建一个记录
namenode返回是否可以上传
client会先对文件进行切分**（是NameNode切分还是Client切分？待确认）**，比如一个blok块128m，文件有300m就会被切分成3个块，一个128M、一个128M、一个44M请求第一个 block该传输到哪些datanode服务器上
namenode返回可以存储的datanode的节点
client请求一台datanode上传数据（本质上是一个RPC调用，建立pipeline），第一个datanode收到请求会继续调用第二个datanode，然后第二个调用第三个datanode，将整个pipeline建立完成，逐级返回客户端
client开始往A上传第一个block（先从磁盘读取数据放到一个本地内存缓存），以packet为单位（一个packet为64kb），当然在写入的时候datanode会进行数据校验，它并不是通过一个packet进行一次校验而是以chunk为单位进行校验（512byte），第一台datanode收到一个packet就会传给第二台，第二台传给第三台；第一台每传一个packet会放入一个应答队列等待应答
当一个block传输完成之后，client再次请求namenode上传第二个block的服务器，循环3-6步
所有块写完后调用关闭 FSdataInputStream，并返回信息给NameData

在这里插入图片描述
用途：对未在镜像文件中的日志和镜像文件进行合并且进行备份

关注