概述
- hdfs是一个分布式文件系统,它所管理的文件被切块存储在若干台datanode服务器上
- hdfs提供了一个统一的目录树,用来定位hdfs中的文件,客户端访问文件是只要指定目录数即可,不用关心文件的具体物理存放位置
- 每一个文件的切块在hdfs的集群中都可以保存多个副本(默认3个)
- hdfs中有一个关键服务进程namenode,它维护了一个hdfs的目录树 及 hdfs目录结构与文件真实存储位置之间的映射关系(元数据),还有一个datanode服务进程专门负责接收和管理“文件块”– block,block的默认大小为128M(可配置) dfs.blocksize