HDFS的优缺点
HDFS的优点:
1)数据冗余、硬件容错
文件以block的方式,多副本存储在集群的节点上,保证硬件的容错,当某一机器损坏时,不至于数据丢失
2)处理流式的数据访问
流式:一次写入,多次读取的操作
3)适合存储大文件
4)可构建在廉价的机器上
缺点:
1)低延迟的数据访问
数据大,想在秒级别做数据的检索不现实
2)小文件索引
不管数据在1M还是127M,都应该对应元数据存放在NameNode上,如果小文件很多,也就意味着所占用的内存信息也越大,那么对于hdfs的NameNode的压力也就越大