Hdfs工作机制之读写操作详解

最新推荐文章于 2024-08-08 16:36:06 发布

ldd儆儆

最新推荐文章于 2024-08-08 16:36:06 发布

阅读量302

点赞数 1

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38304320/article/details/88605472

版权

大数据专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Hdfs的写操作：

在这里插入图片描述

1.客户端向namenode发出请求准备上传文件
2.NameNode接受请求，并进行判断目标文件是否存在，
3.namenode向客户端发出可以是否传的信息
4.客户端则发送block1 ，
6. namenode判断出可以进行存储的3个datanode，（默认3个副本）
7.客户端向namenode指定的最近的datanode发出发送数据和建立pipeline的请求。
8开始建立pipeline
9.客户端发送数据给datanode1—>datanode2---->datanode3
10.当第一个block传输完成(客户端传输给DataNode1完成)后进行传输block2

详细剖析

二.网络拓扑

1.在大型的hadoop集群中，一般都是采用机架的方式进行DataNode节点选择的。

2 .采取机架方式进行组织是需要用户自己进行配置的，如果不进行配置，则采取默认的配置default-rack，则会出现只有一个机架的情况。尽管可能有多个。

3 .一旦配置topology.script.file.name。就依照网络拓扑结构来寻找datanode。topology.script.file.name这个配置选项的value指定为一个可运行程序。在core-site.xml进行配置

4.如图所示，R1，R2等是机架(交换机) D1也是交换机，
判断节点距离依据：俩个节点到达最近的共同祖先的距离之和

三机架感知(副本放置)

1.第版本：
在这里插入图片描述

2.高版本：
在这里插入图片描述
高版本相对于低版本来说提高了传输效率，在可靠性方面也是可以的。

hdfs读操作

在这里插入图片描述
1、跟namenode通信查询元数据，找到文件块所在的datanode服务器
2、挑选一台datanode（就近原则，然后随机）服务器，请求建立socket流
3、datanode开始发送数据（从磁盘里面读取数据放入流，以packet为单位来做校验）
4、客户端以packet为单位接收，现在本地缓存，然后写入目标文件。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。