目录
HDFS简介
前言:
设计思想 》 分为治之 》 将大文件,大批量文件,分布式的存放在大量服务器上。 》 对海量数据运算分析。
在大数据系统架构中的应用 :为各类分布式运算框架提供数据存储服务。
优缺点:
HDFS优点:
高容错性 : 1数据自动保存多个副本.2副本丢失后,自动回复。
适合处理超大文件 :GB、TB、甚至 PB级数据百万规模以上的文件数量
流式文件访问 : 一次性写入,多次读取,保证数据一致性
可构建在廉价服务器上 :1 通过多副本提高可靠性 。2 提供了容错和恢复机制
HDFS缺点:
低延迟数据访问 : 比如毫秒级 低延迟与高吞吐率
小文件存取 : 占用NameNode大量内存
并发写入、文件随机修改 : 1仅支持追加.2一个文件只能有一