可以使用
hdfs fsck /
确定哪些文件有问题。查看输出中是否有丢失或损坏的块(暂时忽略复制不足的块)。该命令特别冗长,尤其是在大型HDFS文件系统上,因此我通常会深入了解
hdfs fsck / | egrep -v '^\.+$' | grep -v eplica
它忽略了只有点和线谈论复制的线。
hdfs fsck /path/to/corrupt/file -locations -blocks -files
/path/to/corrupt/file是指