文章目录
一、HDFS的使用场景
适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用。
二、HDFS 优缺点
(1)优点
> 高容错性
-
数据自动保存多个副本。它通过增加副本的形式,提高容错性。
-
某一个副本丢失以后,它可以自动恢复。
> 适合处理大数据
- 数据规模:能够处理数据规模达到GB、TB、甚至PB级别的数据;
- 文件规模:能够处理百万规模以上的文件数量,数量相当之大。
> 可构建在廉价机器上,通过多副本机制,提高可靠性
(2)缺点
> 不适合低延时数据访问,比如毫秒级的存储数据,是做不到的。
> 无法高效的对大量小文件进行存储。
- 存储大量小文件的话,它会占用NameNode大量的内存