HDFS体系结构详解

最新推荐文章于 2024-04-17 09:14:19 发布

Tom不秃

最新推荐文章于 2024-04-17 09:14:19 发布

阅读量834

点赞数 1

分类专栏：大数据笔记文章标签：大数据 hadoop hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/da13122318861/article/details/118443166

版权

笔记同时被 2 个专栏收录

26 篇文章 0 订阅

订阅专栏

7 篇文章 2 订阅

订阅专栏

HDFS包含：NameNode、SecondaryNameNode、DataNode

HDFS — Hadoop 分布式文件系统是世界上最可靠的存储系统，HDFS 文件系统被设计用于海量文件存储，其优点是存储大文件而不是大量的小文件；HDFS 容错存储层还提供对 Hadoop 和其它元件的支持，HDFS 的数据复制将帮助我们实现这一特征，它能可靠地存储数据，并且几乎不受硬件故障的影响；HDFS提供高吞吐量数据访问应用程序，提供数据的并行访问。

NameNode

NameNode是整个文件系统的管理节点，它主要维护着整个文件系统的文件目录树，文件/目录的元信息，每个文件对应的数据块列表，并且还负责接收用户的操作请求。NameNode 执行文件系统的 Namespace 操作，例如：打开、关闭、重命名文件和目录。NameNode应当部署在相对可靠的硬件环境中。

NameNode主要包含以下文件(core-site.xml-hadoop.tmp.dir/dfs/name/current)：

fsimage（某一时刻NameNode元数据信息、快照）
edits（用户操作记录）
seen_txid（存储edits文件后的数字，NameNode重启时按存储的数字顺序恢复）
VERSION（HDFS版本信息）

SecondaryNameNode

SecondaryNameNode主要负责定期把edits中的内容合并到fsimage

在NameNode的HA架构中是没有SecondaryNameNode进程的，文件合并操作由stanfby NameNode负责实现

DataNode

DataNode提供真实文件数据的存储服务
HDFS会按照固定的大小，顺序对文件进行划分并编码，划分好的每一块称一个Block，HDFS默认Block大小是128MB
HDFS中，如果一个文件小于一个数据块的大小，那么并不会占用整个数据块的存储空间

HDFS 特征

分布式存储
块
复制
高可用性
数据可靠性
容错
可扩展性
高吞吐量程序访问

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
HDFS体系结构详解

HDFS — — Hadoop 分布式文件系统是世界上最可靠的存储系统，HDFS 文件系统被设计用于海量文件存储，其优点是存储大文件而不是大量的小文件；HDFS 容错存储层还提供对 Hadoop 和其它元件的支持，HDFS 的数据复制将帮助我们实现这一特征，它能可靠地存储数据，并且几乎不受硬件故障的影响；HDFS提供高吞吐量数据访问应用程序，提供数据的并行访问。NameNode...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。