优点:
(1)适合存储超大文件:存储级别基本都是GB甚至TB以上。
(2)服务器廉价
(3)流式数据访问:一次写入后,多次读取,当数据作为分析对象后,以后的读取时间比第一次读取少很多时间。
缺点:
(1)实时的数据访问弱:由于存储量大,所以读取数据慢。
(2)大量小文件: 因为Namenode把文件系统的元数据放置在内存中,所以文件系统所能容纳的文件数目是由Namenode的内存大小来决定,影响性能,
(3)不支持多用户写入,任意修改文件:HDFS文件只能有一个写入者,写数据只能在文件末尾添加,不支持多用户写者,不支持数据写入后在文件任意位置修改。