HDFS的读写流程

最新推荐文章于 2023-05-29 15:01:58 发布

熊與猫v

最新推荐文章于 2023-05-29 15:01:58 发布

阅读量948

点赞数

分类专栏：大数据文章标签： hadoop big data

本文链接：https://blog.csdn.net/qq_36448800/article/details/120102106

版权

一，hdfs的读写流程1. hdfs的写入流程文上传流程如下：创建文件： ①HDFS client向HDFS写入数据，先调用DistributedFileSystem.create() ②RPC调用namenode的create()，会在HDFS目录树中指定的路径，添加新文件；并将操作记录在edits.log中 namenode.create()方法执行完后，返回一个FSDataOutputStream，它是DFSOutputStream的包装类建立数据流管道pipel.

摘要由CSDN通过智能技术生成

一，HDFS的读写流程

1. hdfs的写入流程

文上传流程如下：

创建文件： ①HDFS client向HDFS写入数据，先调用DistributedFileSystem.create() ②RPC调用namenode的create()，会在HDFS目录树中指定的路径，添加新文件；并将操作记录在edits.log中 namenode.create()方法执行完后，返回一个FSDataOutputStream，它是DFSOutputStream的包装类
建立数据流管道pipeline ③client调用DFSOutputStream.write()写数据（先写第一个块的数据，暂时叫blk1） ④DFSOutputStream通过RPC调用namenode的addBlock，向namenode申请一个空的数据块block ⑤addBlock返回LocatedBlock对象；此对象中包含了当前blk要存储在哪三个datanode的信息，比如dn1、dn2、dn3 ⑥客户端，根据位置信息，建立数据流管道（图中蓝色线条）
向数据流管道写当前块的数据 ⑦写数据时，先将数据写入一个检验块chunk中，写满512字节后，对此

最低0.47元/天解锁文章

熊與猫v

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
HDFS的读写流程

一，hdfs的读写流程1. hdfs的写入流程文上传流程如下：创建文件： ①HDFS client向HDFS写入数据，先调用DistributedFileSystem.create() ②RPC调用namenode的create()，会在HDFS目录树中指定的路径，添加新文件；并将操作记录在edits.log中 namenode.create()方法执行完后，返回一个FSDataOutputStream，它是DFSOutputStream的包装类建立数据流管道pipel.
复制链接

扫一扫