存储极大数目的信息(terabytes or petabytes),将数据保存到大量的节点当中。支持很大单个文件。提供数据的高可靠性,单个或者多个节点不工作,对系统不会造成任何影响,数据仍然可用。提供对这些信息的快速访问,并提供可扩展的方式。能够通过简单加入更多服务器的方式就能够服务更多的客户端。HDFS是针对MapReduce设计的,使得数据尽可能根据其本地局部性进行访问与计算。