Hadoop之HDFS分布式文件系统

NingKangMing

已于 2024-07-05 13:57:04 修改

阅读量484

点赞数 5

分类专栏： Hadoop 文章标签： hadoop hdfs 大数据

于 2024-06-11 10:12:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012882823/article/details/139591640

版权

Hadoop 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

HDFS简介

Hadoop Distributed File System (HDFS): HDFS 是 Hadoop 的分布式文件系统，它设计用于存储大量数据，并提供高吞吐率的数据访问，通过将数据分块存储在多个节点上，实现数据的冗余存储和容错。

HDFS重要概念

HDFS 通过统一的命名空间目录树来定位文件；另外，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色（分布式本质是拆分，各司其职）。

典型的Master/Slave架构

HDFS集群往往是一个NameNode（HA架构会有两个NameNode,联邦机制）+多个DataNode组成。

分块存储（block机制）

HDFS 中的文件在物理上是分块存储（block）的，块的大小可以通过配置参数来规定。

命名空间（NameSpace）

HDFS 支持传统的层次型文件组织结构。用户或者应用程序可以创建目录，然后将文件保存在这些目录里。文件系统名字空间的层次结构和大多数现有的文件系统类似：用户可以创建、删除、移动。

Namenode 负责维护文件系统的名字空间，任何对文件系统名字空间或属性的修改都将被

Namenode 记录下来。

NameNode元数据管理

NameNode负责存储文件的元数据，比如文件名、文件目录结构、文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。

DataNode数据存储

DataNode是HDFS的工作节点，负责存储实际的用户数据。每个DataNode都会向NameNode注册自己的存储能力，并定期报告自己的状态和已存储的数据块信息。

副本机制

HDFS 中的文件在物理上是分块存储（block）的，每个block通过副本机制来保证其高可用性。

HDFS会自动维护数据块的副本数量，确保数据的高可靠性。

如果某个副本丢失，NameNode会根据当前的网络状况和数据块的副本分布，选择一个合适的DataNode来创建新的副本。

如果某个DataNode失效，NameNode会重新分配其存储的数据块到其他健康的DataNode上。

数据一致性

HDFS使用Write-Once-Read-Many（WORM）模型，确保数据一旦被写入就不能被修改。

在写操作中，NameNode确保所有的副本在提交前都已经成功创建，从而保证数据的一致性。

在读操作中，客户端可以从任何一个副本读取数据，但NameNode会确保客户端获取的是最新的数据版本。

HDFS架构

NameNode（nn）：存储文件的元数据，比如文件名、文件目录结构、文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。

SecondaryNameNode（2nn）：辅助NameNode更好的工作，用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据快照。

DataNode（dn）：在本地文件系统存储文件块数据，以及块数据的校验。

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Hadoop之HDFS分布式文件系统

HDFS 是 Hadoop 的分布式文件系统，它设计用于存储大量数据，并提供高吞吐率的数据访问，通过将数据分块存储在多个节点上，实现数据的冗余存储和容错。
复制链接

扫一扫

专栏目录

博客等级

码龄11年

67
原创

1143
点赞

855
收藏

2233
粉丝

关注

私信

热门文章

分类专栏

Java并发编程 10篇
设计模式 1篇
mybatis 1篇
rancher 2篇
kubernetes 6篇
Redis 5篇
Hadoop 9篇
数据结构与算法
消息中间件 4篇
JVM 5篇
分布式 3篇
Tigase 5篇
Oauth2 1篇
Openfire 8篇
计算机基础 1篇
大数据 1篇
mysql 7篇

最新评论

Maven Nexus3 私服搭建、配置、项目发布指南
泡芙萝莉酱: 博主的文章真是让我大开眼界，对于Maven Nexus3私服搭建和配置这个主题，博主的指南简明扼要，内容丰富详实，让我对这个技术有了更深入的理解。博主的专业知识和经验传递给读者的方式非常清晰易懂，让我受益匪浅。希望博主能够继续分享更多这样有价值的技术文章，不仅让我等读者受益，也让技术领域更加繁荣发展。感谢博主的辛勤分享和支持！
Harbor企业docker私服安装及SSL安全访问配置
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619160314。
Helm部署高可用rabbitmq k8s 镜像集群
恬毅: 写的非常详细，开箱即用，感谢
Tigase8使用smack库实现聊天
NingKangMing: 在这呢兄弟：https://blog.csdn.net/u012882823/article/details/123521542

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。