HDFS的特性
- 海量数据存储 :HDFS 可横向扩展,其存储文件可以支持PB级别数据
- 高容错性 :节点丢失,系统依然可用,数据保存多个副本,副本丢失后自动恢复。可建构在廉价(与小型机大型机比)的机器上,实现线性扩展(随着节点数量的增加,集群的存储能力增加)
- 大文件存储 :DFS采用数据块的方式存储数据,将一个大文件切分成多个小文件,分布存储
HDFS的缺点
- 不能做到低延迟数据访问:HDFS 针对一次性读取大量数据继续了优化,牺牲了延迟性。
- 不适合大量的小文件存储:
A:由于NameNode将文件系统的元数据存储在内存中,因此该文件系统所能存储的文件总数受限于NameNode的内存容量
B:每个文件,目录和数据块的存储信息大约占150字节。
由于以上两个原因,所以导致HDFS不适合存储大量的小文件 - 文件的修改 :不适合多次写入,一次读取(少量读取)
- 不支持多用户的并行写