【HDFS】简介与重要特征

最新推荐文章于 2024-04-24 07:29:36 发布

沉淀的老山羊

最新推荐文章于 2024-04-24 07:29:36 发布

阅读量2.2k

点赞数 6

文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62963408/article/details/128049298

版权

目录

二、重要特性

2.1 主从架构

2.2 分块存储

2.3 副本机制

2.5 元数据管理

2.6 DataNode存储数据块

一.简介

HDFS作为Hadoop三大核心组件之一，主要的功能就是负责数据文件的存储，简单来说HDFS就是Hadoop的文件系统，与传统计算的文件存储方式不同，HDFS采用分布式存储，即在多台计算机上存储文件。
HDFS有着高容错性（fault-tolerant）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。

二、重要特性

2.1 主从架构

HDFS采用了Master/Slave主从架构。由一个NameNode(大哥)管理一定数量的DataNode(小弟)。NameNode不存储数据，只存储Metadata(描述数据的数据)，听起来有点难懂，后面会具体介绍元数据的概念，而存储数据的工作是由DataNode来承担的。

2.2 分块存储

分布式存储最主要的特征就是多机存储，HDFS将一个文件分成多个block(块),再将这些block分别存储再不同的DataNode上，block的大小可以通过配置文件修改，默认是128M

2.3 副本机制

HDFS考虑到文件的安全性，在存储文件时，默认会采用副本机制，就是说一个文件的所有block都具有副本，并存在不同的DataNode上，避免一台机器挂了，文件就找不到的情况，副本的个数也可以通过配置参数来改变，默认是3副本(1个原文件+2个副本文件)

2.4 namespace

HDFS也具有类似window和linux操作系统一样的目录结构，用户可以创建删除目录，创建删除和移动文件...

2.5 元数据管理

前面说到了NameNode不存储数据，只存储元数据，元数据一共具有两种类型。

文件自身属性

文件名、文件大小、权限、副本数、block多大、属于哪个用户

文件块映射位置

文件块分别在哪几个DataNode上

2.6 DataNode存储数据块

文件的多个block可分别存储在不同的DataNode上，不需要都存在一个DataNode上
需要区别的是，副本中相同的block是必需存储在不同的DataNode上的

沉淀的老山羊

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
【HDFS】简介与重要特征

一文带你了解hdfs
复制链接

扫一扫

沉淀的老山羊 CSDN认证博客专家 CSDN认证企业博客

码龄3年

58: 原创

104万+: 周排名

2万+: 总排名

5万+: 访问

: 等级

1356: 积分

592: 粉丝

774: 获赞

5: 评论

728: 收藏

私信

关注

热门文章

分类专栏

Java 35篇
Linux 1篇
MongoDB 2篇
Hadoop 1篇

最新评论

IDEA中git的常用操作（保姆级教学）
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
双亲委派机制
CSDN-Ada助手: 恭喜您撰写了第13篇博客《双亲委派机制》！您在这个主题上的深入研究和分享是非常值得称赞的。我特别喜欢您对双亲委派机制的详细解析，这对我们理解Java中的类加载机制有着重要的启发。在接下来的创作中，我建议您可以继续探索类加载机制的其他方面，比如Java虚拟机的类加载过程中的一些优化技巧或者与双亲委派机制相关的实际应用案例。这将进一步丰富我们的知识，并能够帮助读者更好地理解和应用这些概念。再次感谢您的分享，期待您未来更多精彩的博客！
Java内存模型
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题“Java内存模型”听起来非常有深度。您对Java内存模型的探索和理解，无疑为读者提供了宝贵的知识。不仅如此，您持续创作的努力也让我们感受到了您对技术的热爱和追求。希望您能继续保持这样的创作热情，并在未来的博客中继续分享您对其他相关主题的见解。期待您的下一篇作品！
Java线程池
CSDN-Ada助手: 非常恭喜您写完了第11篇博客，标题为“Java线程池”。您的持续创作真是令人敬佩！通过您的文章，我对Java线程池有了更深入的了解。不仅如此，您的文章还提供了宝贵的经验和技巧。希望您能继续保持这种创作热情，并分享更多有关Java的知识和技术。或许下一步，您可以考虑探讨一下Java线程池的最佳实践或者与其他相关技术的结合应用。期待您的下一篇博客，再次向您表示由衷的祝贺！
【MapReduce】案例
m0_65382857: 求数据

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。