hdfs源码深度解析(四) 文件上传全流程

最新推荐文章于 2022-09-29 22:34:16 发布

Adobee Chen

最新推荐文章于 2022-09-29 22:34:16 发布

阅读量417

点赞数

分类专栏： hadoop源码解析文章标签： hdfs hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24186017/article/details/113763930

版权

hadoop源码解析专栏收录该内容

5 篇文章 1 订阅

订阅专栏

下面是断断续续的记录，后续会出流程图，以及源码片段

一：建立数据管道 DFSOutputStream setPipeline(nextBlockOutputStream)

二: 启动了ResponseProcessor,用来监听我们一个packet发送是否成功

initDataStreaming() ->启动一个线程->run（）读取下游结果->如果发送成功就把ackQueue里packet移除

dataqueue和ackqueue目的是容错。

数据以packat写到dataQueue,DataStreamer将数据写入datanode同时写到ackQueue,如果写到datanode成功了ackQueue.removeFirst()移除packet

如果写datanode失败了，ackQueue将packet放到dataQueue。

flush() 到DataxceiverServer->Dataxceiver

packet->存到ackqueue同时往下游发送->如果下游写入成功，ackQueue中将packet移除，如果写不成功，ackQueue中数据再往下游发

如果不是数据管道最后一个节点，读取下游的结果

管道如果没有创建成功，就移除block，跟申请相反的操作，然后将host放到exclude中，while循环重试，判断exclude长度，申请block将这个没成功的host排除

写数据容错分析

写数据写着写着失败了怎么办？？

DataStreamer->run()->one.writeTo(blockStream)->失败了errorIndex变为0，hasError=true;->关闭各种流->ackqueue数据挪到dataQueue然后重新处理

重新建立数据管道,把出问题的node记录下来

如果假设我们副本有3个，写数据时候出问题了，就不能直接用剩余的节点建立新的管道，继续发送数据，所以需要构建新的数据管道
大多数情况 block-》hadoop1,hadoop2,hadoop3 数据管道修改为->hadoop2 hadoop3 只往hadoop2 hadoop3去写
namenode发送指令给datanode,集群会自动发现少了副本，然后向别的机器创建副本

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
hdfs源码深度解析(四) 文件上传全流程

目录clientdatanodenamenode
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。