hadoop fsck / -files -blocks
会告诉集群中块的分配情况
当集群中的datanode数小于3时,块的复制份数也不会超过3
分析结果是:文件不够一个块的大小时,也单独占用一个块。
查看map源码,map任务也不会跨文件处理
hadoop fsck / -files -blocks
会告诉集群中块的分配情况
当集群中的datanode数小于3时,块的复制份数也不会超过3
分析结果是:文件不够一个块的大小时,也单独占用一个块。
查看map源码,map任务也不会跨文件处理