1、数据块
1、数据块是抽象块,而非整个文件作为存储单元
2、默认大小为64M,一般设置为128M,备份x3
如下:假如你的每张磁盘只有100M,那么如果你要存一个300M的文件,是不是任何一张磁盘都存不下?那么这个时候,将300M的文件分为3个数据块,每个数据块存在一个磁盘中即可。
2、NameNode和DataNode
上文说到,HDFS是一个分布式文件系统,那么自然就有主从,NameNode就是从,而DataNode就是从。所以HDFS就是由一个NameNode和多个DataNode组成的。
NameNode:管理文件系统的命名空间,存储文件元数据;维护着文件系统的所有文件和目录,文件和数据块的映射;记录每个文件中各个块所在数据节点的信息
DataNode:存储并检索数据块,向NameNode更新所存储块的列表