【HDFS】基本概念

本文介绍了Hadoop分布式文件系统HDFS的基本概念,包括块、NameNode、DataNode和Secondary NameNode的角色。详细阐述了HDFS的体系结构,强调了NameNode的元数据管理和DataNode的数据存储。此外,还讨论了HDFS的数据存取原理,如数据存放策略和错误恢复机制。
摘要由CSDN通过智能技术生成

3.1 HDFS简介

分布式文件系统HDFS,全称为“Hadoop平台上的分布式文件系统”,需要实现以下目标:

  • 兼容廉价的硬件设备
  • 流数据读写
  • 大数据集
  • 简单的文件模型
  • 强大的跨平台兼容性

3.1.1块

HDFS默认一个块64MB,一个文件被分成多个块,以块作为存储单位。

块的大小远远大于普通文件系统,可以最小化寻址开销。

DFS采用抽象的块概念可以带来以下几个明显的好处:

  • 支持大规模文件存储:文件以块为单位进行存储,一个大规模文件可以被分拆成若干个文件块,不同的文件块可以被分发到不同的节点上,因此,一个文件的大小不会受到单个节点的存储容量的限制,可以远远大于网络中任意节点的存储容量。
  • 简化系统设计:首先,大大简化了存储管理,因为文件块大小是固定的,这样就可以很容易计算出一个节点可以存储多少文件块;其次方便了元数据的管理,元数据不需要和文件块一起存储,可以由其他 系统负责管理元数据
  • 适合数据备份:每个文件块都可以冗余存储到多个节点上,大大提高了系统的容错性和可用性

3.1.2NameNode

NameNode(nn):存储文件的元数据,如文件名、文件目录结构、文件属性索引

保存了两个核心的数据结构:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐的冲浪码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值