Hadoop学习笔记：分布式文件系统HDFS

最新推荐文章于 2024-07-25 09:48:00 发布

GaryBigPig

最新推荐文章于 2024-07-25 09:48:00 发布

阅读量479

点赞数

分类专栏： Hadoop 文章标签： Hadoop HDFS 分布式文件系统大数据云计算

本文链接：https://blog.csdn.net/fegang2002/article/details/85981367

版权

本文详细介绍了Hadoop分布式文件系统HDFS的设计思想、架构、内部机制和高可用性。HDFS具有高容错性、适合大数据处理等特点，但也存在高延迟访问和不支持小文件等问题。文章讨论了HDFS的NameNode和DataNode角色，以及数据读写、容错策略和程序设计方法。

摘要由CSDN通过智能技术生成

HDFS（Hadoop Distributed File System）源自于Google发表于2003年10月的GFS论文，HDFS是GFS克隆版。它是一个易于扩展的分布式文件系统，可以运行在大量普通廉价机器上，它提供容错机制，为大量用户提供性能不错的文件存取服务。
它具有以下优点：

它也具有以下缺点：

分布式文件系统的一种实现方式
在这里插入图片描述以上方案不好做负载均衡和容错，不支持计算框架的并行处理。HDFS将每个文件分成等大的数据块（默认128M），然后分成多副本（默认3个）均匀的放在不同的节点上，解决了负载均衡和容错的问题，同时也支持计算框架的并行运算。

关注

专栏目录