计算机集群结构
分布式文件系统把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群。
目前的分布式文件系统所采用的计算机集群都是由普通硬件构成的,这就大大降低了硬件上的开销。
HDFS默认一个块128MB,一个文件被分成多个块,以块作为存储单位。
块的大小远远大于普通文件系统,可以最小化寻址开销
抽象的块概念可以带来以下几个明显的好处:
支持大规模文件存储
简化系统设计
适合数据备份
- HDFS的命名空间包含目录、文件和块
- HDFS使用的是传统的分级文件体系,因此,用户可以像使用普通文件系统一样,创建、删除目录和文件,在目录间转移文件,重命名文件等
- NameNode维护文件系统命名空间。对文件系统命名空间或其属性的任何更改由NameNode记录