我的DataNode中存放Block的位置是
/usr/local/myHadoop/hadoop-2.6.0/tmp/dfs/data/current/BP-1425842400-192.168.1.101-1451701156704/current/finalized/subdir0/subdir0
DataNode存储数据的时候,都是以block形式存储。block是DataNode存储数据的基本单位。默认Block的是128MB,这是每个Block的最大大小,而不是每个Block的大小都是128MB。当一个12k的数据存放到Datenode中时,它会占用一个Block中,该block只占用12k的磁盘物理空间。
查看fsimage的内容时,发现每个文件都有block对应。fsimage的内容在集群运行时,存放在内存中。
每个文件会产生至少一个block。当小文件非常多的时候,每个文件作为一个对象,元数据的数据量就会很大,耗费内存,造成NameNode内存压力大。所以使用hdfs的时候,尽可能让文件大一些。