Hadoop的读写流程

以后不会有早八了

已于 2023-12-30 21:10:47 修改

阅读量488

点赞数 11

文章标签： hadoop 大数据分布式

于 2023-12-30 21:10:37 首次发布

本文链接：https://blog.csdn.net/2301_79995310/article/details/135309663

版权

一. 请简述 HDFS的数据写入流程

1.应用程序通过HDFS客户端向NameNode发起远程过程调用请求。
2.NameNode检查要创建的文件是否存在以及是否有足够的权限。
3.如果检测成功，NameNode会返回一个该文件的记录，否则让客户端抛
4.HDFS客户端把文件切分为若干个packets，然后向NameNode申请新的blocks存储新增数据。
5.NameNode返回用来存储副本的数据节点列表。
6.HDFS客户端把packets中的数据写入所有的副本中。
7.最后一个节点数据写入完成以后，客户端关闭。

二. 请简述 HDFS的数据读取流程

1.客户端发送读取文件请求给namenode
2.namdnode接收到请求,然后进行一系列校验,如果没有问题,就告知可以读取
3.就近挑选一台datanode服务器,开始读取文件对应的block块信息,放到内存缓冲区中
4.读取其他block块信息,直到所有block块读取完毕
5.最后从内存缓冲区把数据通过流写入到目标文件中
6.数据读取完成以后，HDFS客户端关闭与当前的datanode的链接。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

以后不会有早八了

关注关注

11
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
Hadoop的读写流程

一. 请简述 HDFS的数据写入流程。二. 请简述 HDFS的数据读取流程。
复制链接

扫一扫

【hadoop_读写流程】

weixin_47922102的博客

11-17

836

nn回去检查这个路径的文件是否已经存在，是否有权限能够创建这个文件，2.Client 不一定在DN节点，随机选择一个DN。3.HDFS 副本放置策略【面试，生产都会用到】此时，任然没有写数据，不关联任何的block块。hadoop 、hive hadoop用户。放置在第一个副本的不同机架上的某个DN节点。杀死进程：kill -9 pid 暴力杀死。hive 创建一个hive用户。生产上读写操作，选择DN节点进行读取。1.放置在client上传的DN节点。杀死进程： kill id;

Hadoop：HDFS读写数据的过程。

最新发布

weixin_53571731的博客

07-20

865

6、客户端开始往第一个DataNode上传第一个Block（先从磁盘读取数据放到本地内存缓存），以Packet为单位，当第一个DataNode收到一个Packet就会传给第二个DataNode，然后传给第三个DateNode。5、客户端通过FSDataOutputSTream模块请求第一个DataNode上传数据，第一个DataNode收到请求后会继续调用第二个DataNode，然后第二个DataNode调用第三个DataNode，将这个通信管道建立完成，三个DataNode逐级应答客户端。

参与评论您还未登录，请先登录后发表或查看评论

Hadoop HDFS 读写流程

lucklilili

08-16

290

客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件，NameNode 检查目标文件是否已存在，父目录是否存在。 NameNode 返回是否可以上传。客户端请求第一个 Block 上传到哪几个 DataNode 服务器上。 NameNode 返回 3 个 DataNode 节点，分别为 dn1、dn2、dn3。（5）客户端通过 FSDataOutputStream 模块请求 dn1 上传数据，dn1 收到请求会继续调用dn2，然后 dn2 调用 ...

一起重新开始学大数据-hadoop篇-Day45-hdfs解析和zookeeper安装

tiand7的博客

08-30

465

一起重新开始学大数据-hadoop篇-Day45- hadoop启动脚本详细启动脚本介绍第一种：全部启动集群所有进程启动：sbin/start-all.sh 停止：sbin/stop-all.sh 第二种：单独启动hdfs【web端口50070】和yarn【web端口8088】的相关进程启动：sbin/start-dfs.sh sbin/start-yarn.sh 停止：sbin/stop-dfs.sh sbin/stop-yarn.sh 每次重新启动集群的时候使用第三种：单独启动某一个进程

Hadoop读写流程与2x架构-详细分析

12-22

机架感知策略，三者的作用（DateNode，NameNode，SecondNameNode）

hadoop 读写文件流程详解

09-19

在hadoop中，有三大法宝——HDFS，MapReduce，Hbase，但是无论是MapReduce，Hbase还是hadoop中的其他组件如：Hive等他们要处理的...可见HDFS可以说是hadoop存储的基础和核心，因此对HDFS的文件读写操作显得十分重要。

Hadoop技术HDFS数据读写流程共7页.pdf.zip

11-21

本文件" Hadoop技术HDFS数据读写流程共7页.pdf "显然提供了关于HDFS数据读写过程的详细信息，虽然实际的文档内容无法在此直接展示，但根据标题和描述，我们可以深入探讨HDFS的数据读写流程，以及它在Hadoop生态系统...

hadoop2 文件读写原理

06-25

在Hadoop 2中，文件读写是分布式存储系统的核心操作。本文档将详细解析Hadoop 2如何处理文件的创建、数据写入以及关闭文件的过程。以下是对这一原理的深入探讨。首先，我们来看一下文件写入的流程： 1. **文件...

HADOOP大数据平台系统思路流程图.rar

05-10

HBase是一个基于HDFS的NoSQL数据库，适合实时读写操作，可以和Hadoop无缝集成，提供低延迟的数据访问。Spark则是一个用于大规模数据处理的快速、通用和可扩展的引擎，通过内存计算显著提高了数据处理速度。Flink是一...

hadoop读写流程以及四种机制

weixin_42130191的博客

06-10

1015

hadoop读流程读流程：客户端通过 Distributed FileSystem 向 NameNode 请求下载文件，NameNode 通过查询元数据，找到文件块所在的 DataNode 地址。挑选一台 DataNode（就近原则，然后随机）服务器，请求读取数据。 DataNode 开始传输数据给客户端（从磁盘里面读取数据输入流，以 Packet 为单位来做校验）。客户端以 Packet（64k）为单位接收，先在本地缓存，然后写入目标文件。 ...

hadoop文件读写过程

milyhj123的博客

05-19

413

读入过程： 1.客户端通过RPC与Namenode通信，namenode返回一个输入流（FSDataInputStream对象）供客户端调用read方法不断读取数据。 2.输入流对象封装DFSInputStream对象，该对象管理着namenode和datanoded I/O,接着DFSInputStream连接到存储着所要读取的文件块的距离客户端最近的datanode的数据输出给客户端，读取

hadoop之文件读写流程

吴成伟的博客

04-04

906

写文件流程 1.调用客户端的对象DistributedFileSystem的create方法 2.DistributedFileSystem会发起对namenode的一个RPC连接,请求创建一个文件,不包含关于block块的请求.namenode会执行各种各样的检查,确保要创建的文件不存在,并且客户端有创建文件的权限.如果检查通过,namenode会创建一个文件(在edits log中,同时更新...

Hadoop 读写流程和常用命令

创作都市模板

07-08

362

Hadoop 读写流程和常用命令 1.读流程 client向分布式文件系统DistributionFileSystem发送读请求 分布式文件系统与NameNode进行Rpc通信 NameNode对文件是否存在,用户是否有权限等进行校验,校验如果成功,则向分布式系统返回一个FsDataInputStream对象(包含了文件由哪些块组成,block分布在哪些节点等等信息) client...

HADOOP的读写数据流程

weixin_47681855的博客

09-29

1104

写数据的流程所有的设备搭建都是基于客户需求(上传、下载、临时存储........)之上而来的,有了这些设备以后搭建集群,开启服务给客户提供相应的需求 NN(主节点)一般先开机,初始化之后,会接收各个DN(从节点)开机以后发送的注册信息以及其资源存储情况当客户端有上传的需求时,会首先给NN发送上传请求 NN收到请求以后,判断集群中的资源情况,当资源足够时返回ok 客户端开始上传第一块数据的元数据信息当NN接收到元数据信息时,会向客户端返回3台DN机器的位置(每来一块数据都返回3台节点机)--

Hadoop-HDFS-读写流程详解

qichangjian的博客

02-20

964

HDFS写数据流程：详细步骤图：详细描述： 1.客户端向NN发送文件上传的请求 2.NN进行一系列的检查：是否有权限，文件的父目录是否存在，文件是否已经存在同名等等，检查通过，允许上传 3.NN告知客户端允许上传 4.客户端发送真正的文件上传的请求，请求包含一个重要信息，文件的长度/大小 5.NN根据文件的长度计算文件的切块的个数（200M/128M = 2）,以及获取文本的配置信息dfs...

Hadoop HDFS读写流程

王峥Jeff的博客

11-19

410

HDFS 读数据流程原理图：读取过程分析—图示：读取过程分析—描述: 1.客户端或者用户通过调用FileSystem对象的open()方法打开需要读取的文件，这对HDFS来说就是常见的一个分布式文件系统的一个读取实例 FileSystem通过远程协议调用NameNode确定文件的前几个Block的位置。对于每一个Block，NameNode返回一个含有该Block拷贝...

Hadoop HDFS读写流程与NameNode机制解析

"大数据框架知识点总结，主要关注Hadoop的HDFS读写流程及NameNode与SecondaryNameNode的工作机制。" 在大数据处理领域，Hadoop是一个关键的开源框架，其分布式文件系统（HDFS）提供了高容错性和高吞吐量的数据存储...