HDFS的读写流程

最新推荐文章于 2024-05-10 09:00:43 发布

__顾影自怜

最新推荐文章于 2024-05-10 09:00:43 发布

阅读量1k

点赞数 1

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a2639491403/article/details/80068831

版权

hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HDFS写流程

客户端发起写请求道namenode，namenode返回可使用的资源，客户端根据资源使用情况对要写入的数据分块，逐一上传块到datanode,datanode获取上传块数据并写入磁盘，完成后报告给namenode块信息，同时也告诉客户端写入成功，客户端继续后续快的写入，在此期间namenode接受到datanode的块写入完成信息之后根据备份数直到满

1 首先客户端发起写请求到namenode,nanmenode检查目标是否存在，父目录是否存在。

2 namenode通知client是否可以上传。

3 client上传时，先对文件进行切分成块，默认block为128MB。client向namenode请求第一个block需要传输到哪个datanode上。

4 namenode接收到请求，返回datanode节点，默认为3（d1在datanode的节点上d2在datanode的不同节点上，d3在不同datanode的任意节点上）。

5、client请求一台datanode上传数据（本质上是一个RPC调用，建立pipeline），第一个datanode收到请求会继续调用第二个datanode，然后第二个调用第三个datanode，将整个pipeline建立完成，逐级返回客户端即客户端请求d1上传数据,d1收到请求会继续调用d2，然后d2调用d3建立通信管道。

6 三个节点逐级答应客户端

7 客户端开始往d1节点上传第一个block（先从磁盘中读取数据放到一个本地内存缓存），以packet（数据包，64kb）为单位。

8 当第一个block传输完后，客户端再次请求namenode上传第二个接收block的datanode节点，直到满足备份为止

HDFS读流程

客户端发发起请求到namenode，namenode返回可使用资源，客户端根据使用资源到对应的datanode上读块数据，客户合并文件数据

1 和namenode通信查询元数据（block所在的datanode节点），找到块所在的datanode服务器

2 挑选一台datanode（就近原则，然后随机）服务器请求建立socket（套接字）流

3 datanode发送数据，从磁盘读取数据放入流，以packet为单位来做校验。

4 客户端以packet为单位接收，现在本地缓存，然后写入目标文件，最后合成文件。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
HDFS的读写流程

HDFS写流程客户端发起写请求道namenode，namenode返回可使用的资源，客户端根据资源使用情况对要写入的数据分块，逐一上传块到datanode,datanode获取上传块数据并写入磁盘，完成后报告给namenode块信息，同时也告诉客户端写入成功，客户端继续后续快的写入，在此期间namenode接受到datanode的块写入完成信息之后根据备份数直到满1 首先客户端发起写请求到n...
复制链接

扫一扫

专栏目录

__顾影自怜 CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

24万+: 周排名

140万+: 总排名

10万+: 访问

: 等级

1026: 积分

26: 粉丝

30: 获赞

9: 评论

113: 收藏

私信

关注

热门文章

分类专栏

转载笔记 3篇
个人 11篇
hive 2篇
spark 1篇
linux基础 1篇
hadoop 2篇
mysql 1篇
flume 3篇
kafka 2篇
scrapy 3篇
requests 3篇

最新评论

python 第一天
2401_8308552: 讲的仔细，适合“新手入门知识”。
在spark中将数据插入HIVE表
AhLe丶: 这一堆错别字真的极品
kafka安装及使用
秃秃的程序猿: 挺详细，适合新手，谢谢大佬！！！
在spark中将数据插入HIVE表
罗密欧V1: 将集群或者你要写入的hive的配置文件中的hive-site.xml 复制到工程目录resources下然后初始话sparksession的时候，加上.enableHiveSupport() 例如[code=plain] val spark = SparkSession.builder().appName("sqlInsert") .master("local[*]").enableHiveSupport().getOrCreate() [/code]
在spark中将数据插入HIVE表
1818科研分队: 你好，想问你一下，spark怎么连hive？没看到连hive的操作。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。