HDFS通信机制

最新推荐文章于 2023-04-13 15:19:02 发布

醉与浮

最新推荐文章于 2023-04-13 15:19:02 发布

阅读量737

点赞数

分类专栏： hdfs 文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45409055/article/details/127359269

版权

hdfs 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.通信的三个实体

NameNode（nn）：维护datanode的分布和任务的调度

DataNode（dn）：存储数据的地方

DFSClient：提供接口来访问namenode和datanode

三者通信都基于TCP/Scocket

2.控制信息

整体链路是Client向namenode发起请求。等datanode的heartbeat信息到了时。nn把控制信息一并作为respon发送给datanode。然后有client与某个datanode交互。这个datanode在与其他datanode交互（串行，一个接一个，传递数据）

namenode从来不会主动的发信息给datanode。

所有的控制信息都是基于RPC进行，datanode之间会建立一个RPC链接。用scoket传输数据。

datanode和client之间有两个线程，一个负责调用scoket，往里写数据，写完后执行wait（）阻塞。

还有一个负责scoket的读。消息来了后执行notify（）唤醒线程

3.数据信息

一个socket的RCP方式吞吐量并不大，传递控制信息可以。但是传递数据信息尚有不足。所以hdfs用了另外一种通信机制。XceiverServer

DataNode启动的时候会创建DataXceiverServer负责block读写。其工作内容为一有链接就创建DataXceiver

DataXceiver也是一个线程，它负责处理对应的一个连接，主要完成4种任务：
opReadBlock：读取一个block
opWriteBlock：写一个block到disk上
opCopyBlock：读一个block，然后送到指定的目的地
opReplaceBlock：替换一个block

DataXceiverServer对于每个链接都会创建一个DataXceiver线程。当两个datanode数据请求频繁的时候。就会建立多个链接，吞吐量up

4.总结

Xciver方式使用的是one thread per request模型。每一个请求创建一个线程。

这种模型的缺点是当请求量大时，因为并发数多，会涉及到很多context switch。

那为什么hdfs还是用这个模型呢？我们观察三个实体和三者间的交互

datanode和client的交互

在读操作中，是由多个datanode并发的给client发送数据。但是client数量不会太多，一般开发人员只是会留固定的接口。

在写操作中，一个client会向第一个datanode点对点的发送数据，后续block由第一个datanode链式传递给其他node。所以数量不多。

datanode之间的交互

datanode间不涉及读操作，读是datanode和client直接交互

写操作：只有datanode间会复制block，且一对一链式传递。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
HDFS通信机制

简单介绍hdfs的通信实现原理
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。