hdfs源码分析思路

最新推荐文章于 2024-01-07 10:52:54 发布

「已注销」

最新推荐文章于 2024-01-07 10:52:54 发布

阅读量2k

点赞数

分类专栏： Hadoop 文章标签：数据结构 hadoop 工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/joe_007/article/details/6789001

版权

Hadoop 同时被 2 个专栏收录

116 篇文章 3 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

最近在看caibinbupt的hadoop的源码分析的文章，下面对于他的分析思路以及先后顺序做个小结：

1.首先前八章是介绍hdfs的RPC机制；

2.从第九章开始介绍hdfs的内容：

2.1分析hdfs，包括namenode，datanode，作者先分析了datanode；

2.2从第九章------第一七章分析了datanode

2.3datanode的实现包括两部分：对本地数据块的管理；和其他的实体打交道；

2.4作者先从目录dfs/data开始，分析了data目录下面的各个文件的用途；

2.5作者接着分析了系统的工作状态（升级回滚之类），并且分析了系统在升级会滚等操作时datanode的中发生了什么状态（previous，current等目录结构的编化）；

2.6作者分析了Storage类以及相关类StorageInfo，StorageDirectory，DataStorage等；

2.7作者分析了FSDataset相关的类（这个类对block进行操作）；

2.8作者分析了datanode的动态行为类Dataceiver，BlockSender，BlockReceiver等（真正的读写）；

2.9作者分析了datanode上的非主流程DataBlockScnner；

2.10作者最后分析了DataNode这个类以及相关的类图

***总的来说，在分析源码的时候应采用《总---分---总，静---动》的结构，也就是先从大局上掌握核心脉络，然后深入到各个依赖的核心数据结构，最后再回到原点；先分析类与类之间的静态结构，然后再分析动态行为，动态交互。

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。