HDFS的优点:
1、分布式存储
可以将一个100TB的大文件村部存储在100台机器上,当从hadoop集群的任何一台机器上登陆都可以访问到这100TB的文件。
2、分布式并行计算
例如一台机器计算100TB数据需要100分钟,即计算1TB需要一分钟,如果把这100TB分配到100台机器上一分钟就可以计算完。
3、水平可伸缩
即向现有集群添加更多节点,而不是增加单个机器的硬件容量。重要的是可以在不停止系统的情况下添加更多机器,即我们在扩大规模的同时没有任何停机或绿色地带,在添加机器结束后集群将有更多的机器并行工作以满足系统要求。