HDFS读写数据过程原理分析

最新推荐文章于 2024-07-22 02:03:32 发布

置顶

Lino_white

最新推荐文章于 2024-07-22 02:03:32 发布

阅读量3.9k

点赞数 8

分类专栏： Hadoop 文章标签： hadoop 大数据 hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/white_mvlog/article/details/106058324

版权

Hadoop HDFS读写数据过程原理分析

在学习hadoop hdfs的过程中，有很多人在编程实践这块不知道该其实现的原理是什么，为什么通过几十行小小的代码就可以实现对hdfs的数据的读写。
在下面的介绍中会详细的说明该其过程实现的原理（图片选自中国大学MOOC[大数据技术原理与应用]课程）。

一、读数据的原理分析

在这里插入图片描述

1. 打开文件。

        用Java导入FileSystem类，通过FileSystem.get(conf)声明一个实例对象fs，从而分布式系统底层的配置文件会被项目所调用，如core-site.xml、hdfs-site.xml；进而生成一个子类DistributedFileSystem，这时候实例对象fs与分布式系统也就紧紧相关了。
        由于我们要读数据，当然就需要使用到输入流，这时候输入流的类型是FsDataInputStream，其中封装着DFSInputStream。
        在这里为什么我们看不见或者无法调用DFSInputStream呢，因为这是Hadoop后台自动给其封装的好的，真正与Hadoop当中的名称节点进行交流的，其实是DFSInputStream，而不是FsDataInputStream。
        FsDataInputStream在项目中是干嘛呢，其实是与客户端进行交流的。

2. 获取数据块信息

最低0.47元/天解锁文章

关注

8
点赞
踩
23

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。