1.海量数据存储:
HDFS可横向扩展,其存储的文件可以支持PB级别或更高级别的数据存储
2.高容错性:
数据保存多个副本,副本丢失后自动恢复。可构建在廉价的机器上,实现线性扩展(线性扩展:配置增强,性能直线增强),当集群增加新节点之后,namenode也可以感知,进行负载均衡,将数据分发和备份数据均衡到新的节点上
3.商用硬件:
Hadoop并不需要运行在昂贵且高可靠的硬件上。它是设计运行在商用硬件(廉价商用硬件)的集群上的
4.大文件存储:
HDFS采用数据块的方式存储数据,将数据物理切分成多个小的数据块。所以再大的数据,切分后,大数据变成了很多小数据。用户读取时,重新将多个小数据块拼接起来