- HDFS:Hadoop 中的分布式文件系统
- Hadoop Distributed File System,存储和管理海量数据
- 文件系统( File System ):
- 为了管理文件,在存储系统上建立的一些文件组织和结构
- 主要包括文件目录和文件本身
- 分布式(Distributed):
- 由多台服务器组成
- 每台服务器执行不同的功能
不同的功能配合起来形成完整的功能
- HDFS 上存储的文件由块和元数据组成block(块)
- 文件按照 block size(128M)切分为不同的 block
- 不同的 block 存储在不同的 DataNode 上