对于大数据来说,数据量是巨大的,多样性的,而且后期是要进行本地计算的,这样的话数据的存储要求是可靠的来保证数据的不丢失,HDFS就实现了这样的一个功能。 在处理大数据的过程中,一个数据文件会相应存储在hdfs上不同节点的不同文件中,把这些文件组织起来放到不同的文件夹中,这种组织方式叫做命名空间。