HDFS优缺点
优点:
- 高容错、高可用、高扩展。
HDFS有副本冗余机制,包括其自身在内默认会有3个副本随机存放在集群的不同的服务器上,如果服务器宕机,HDFS会通过COPY的方式永远保证数据的副本不会低于三个。
- 海量数据存储
- 构建成本低、安全可靠
- 适合大规模离线批处理
流式数据访问,HDFS 一次写入,多次读取,支持追加,不允许修改,保证数据一致性。
数据位置暴露给计算框架。
缺点
- 不适合低延迟数据访问
在某一时间内大量写入、读取数据,但是毫秒级这种低延时它是支持不了的。
- 不适合大量小文件存储
元数据占用NameNode大量内存空间。
网络IO会占用大量时间。
- 不支持并发写入
- 不支持文件随机修改
只支持追加