HDFS具有如下几大特点: [list=1] [*]硬件错误 [*]流式数据访问 [*]大规模数据集 [*]简单的一致性模型 [*]异构软硬件平台间的可移植性 [/list] 学习HDFS重点要明白Namenode 和 Datanode的功能。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问,一般集中中只有一个Namenode,但随着集群中文件数量的增大,Namenode需求的内存也会增加,启动时间也会加长,所以可以考虑Secondary NameNode。Datanode主要是存放数据。