Hadoop分布式文件系统——HDFS的读写

最新推荐文章于 2022-04-29 12:14:19 发布

VIP文章神探狄仁杰

最新推荐文章于 2022-04-29 12:14:19 发布

阅读量1.9k

点赞数 1

分类专栏： snake spirit technology 文章标签： hadoop 分布式文件系统 hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/napo_leon/article/details/50560026

版权

HDFS是运行在通用硬件平台上的可容错分布式文件系统。它优化了大文件的流式读取模式，适用于那些高吞吐并且对延迟性要求相对比较低的场景。它还通过文件“一次写入，多次读取”的简单策略保证了数据的一致性。HDFS亦使用了“块复制”的概念，让数据在集群的节点间进行复制，每个数据块复制的份数由“复制因子”决定。
HDFS包含三个服务：
A、NameNode：保存着集群中所有数据块位置的一个目录。
B、Secondary NameNode：周期性同步NameNode的块索引数据。在同步处理中，Secondary NameNode下载NameNode的image文件和editlogs，并对它们做本地归并，最后再将归并完的image文件发回给NameNode。Secondary NameNode并不是NameNode的热备份，当NameNode故障的时候它并不能工作。
C、DataNode：管理着从NameNode分配过来的数据块。它并不能感知集群中其他DataNode的存在，只和NameNode进行交互。
一、HDFS的读写操作：

public class HdfsWriter extends Configur

最低0.47元/天解锁文章

神探狄仁杰

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hadoop分布式文件系统——HDFS的读写

HDFS是运行在通用硬件平台上的可容错分布式文件系统。它优化了大文件的流式读取模式，适用于那些高吞吐并且对延迟性要求相对比较低的场景。它还通过文件“一次写入，多次读取”的简单策略保证了数据的一致性。HDFS亦使用了“块复制”的概念，让数据在集群的节点间进行复制，每个数据块复制的份数由“复制因子”决定。 HDFS包含三个服务： A、NameNode：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。