HDFS 的架构和读写流程

最新推荐文章于 2024-05-27 22:36:37 发布

bu6_buf

最新推荐文章于 2024-05-27 22:36:37 发布

阅读量699

点赞数 1

分类专栏：大数据

本文链接：https://blog.csdn.net/bu6_buf/article/details/106029628

版权

本文介绍了HDFS的架构，包括NameNode、DataNode和SecondaryNameNode的角色。详细阐述了HDFS文件的写入过程，从客户端创建文件到数据确认的整个流程，以及namenode如何选择datanode存储复本的策略。同时，文章还讲解了文件读取步骤，描述了客户端如何通过NameNode获取DataNode地址并直接读取数据，以实现高并发和高效的系统设计。

摘要由CSDN通过智能技术生成

HDFS 的架构

  NameNode ：负责文件元数据信息的操作以及处理客户端的请求。
  DataNode：负责存储实际的数据块，执行数据块的读/写操作。
  SecondaryNameNode：保存 namenode 中对 HDFS metadata 的信息的备份，并减少 namenode 重启的时间。
在这里插入图片描述

HDFS读写数据流的流程

文件写入
  1、客户端对 DistributedFileSystem 对象调用create() 。
  2、DistributedFileSystem 请求 NameNode，NameNode返回是否可以上传。
  3、DistributedFileSystem 向客户端返回 FSDataOutputStream对象（ FSDataOutputStream对象封装了一个DFSOutputStream对象，该对象负责处理namenode和datanode之间的通信），客户端对 FSDataOutputStream对象写入数据。
  4、DFSOutputStream将它分成一个个的数据包，并写入内部队列（数据队列），由 DataStreamer挑选出适合存储副本的一组datanode，并据此向namenode请求分配新的数据块来存储数据队列 —— 假设复本数为3，管线中就有3个节点（dn1、dn2、dn3），Da

最低0.47元/天解锁文章

bu6_buf

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HDFS 的架构和读写流程

HDFS 的架构  NameNode ：负责文件元数据信息的操作以及处理客户端的请求。  DataNode：负责存储实际的数据块，执行数据块的读/写操作。  SecondaryNameNode：保存 namenode 中对 HDFS metadata 的信息的备份，并减少 namenode 重启的时间。HDFS读写数据流的流程文件写入  1、客户端对 DistributedFileSystem 对象调用create
复制链接

扫一扫