Hadoop源码情景小析（1）fs -copyFromLocal

最新推荐文章于 2023-08-13 11:42:27 发布

Dinosoft

最新推荐文章于 2023-08-13 11:42:27 发布

阅读量2.6k

点赞数

分类专栏： hadoop 文章标签： hadoop path 数据结构 statistics generation java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dinosoft/article/details/7369060

版权

本文适合Hadoop初学者，通过分析Hadoop 0.20.203版本的源码，理解`hdfs dfs -copyFromLocal`命令的执行流程。从FsShell开始，涉及FileUtil、FileSystem、DistributedFileSystem、DFSOutputStream、DataStreamer等关键类，揭示了HDFS如何协调NameNode、DataNode进行文件复制。FSDataOutputStream的writeChunk过程是核心，梳理了HDFS内部数据流经的路径。

摘要由CSDN通过智能技术生成

第一次读比较大型的源码。有看到列一大幅类图的，一看头就大。有看到简要分析主要数据结构的，因为源码这么多，总不能事无具细地全讲一遍吧。但少了程序运行的脉络，总让人疑惑系统到底怎么运转起来的。我想，对于初学者，还是从程序运行的线索入手，按功能弄清每个模块的代码，然后连点成线，成面，最终从宏观再整理清整个系统架构，这样还能顺便学习一下大型系统的实现。当然，对于架构大牛，或者java大牛，可能就不需要这么细的去看，毕竟其中起粘合剂的部分对于大多数系统来说都是相似的。看一下宏观的架构分析就行了。

适合的读者？

当然是初学者。我自己本身也只是java菜鸟，对面向对象还是有一点点体会的。毕竟hadoop是用java写的，至少也要有一点java基础什么的才能看得懂吧，虽然要求也不高。

分析过程也只能抓重点，不可能每一行代码都去深究。版本是hadoop 0.20.203 。好吧，我们从命令

hadoop fs -copyFromLocal xx xx

开始。hadoop支持多种文件系统，当然，这里我们关心的是hdfs。先上图，后面讲完再解释。

hdfs 的shell命令是由类FsShell去执行的。

  public static void main(String argv[]) throws Excepti

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。