CDH中出现丢失块处理

hcq_lxq

已于 2022-04-15 10:10:18 修改

阅读量1.5k

点赞数

分类专栏：大数据/HDFS/CDH/sqoop 文章标签：数据库 sql hdfs

于 2021-11-30 11:21:20 首次发布

本文链接：https://blog.csdn.net/hcq_lxq/article/details/121628219

版权

大数据/HDFS/CDH/sqoop 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1、描述

集群报块丢失的原因很多，一般CM界面会提示出来。出现这种情况该如何解决呢：

2、修复

先检测已损坏的块

fsck命令来检查各种块不一致情况。

hdfs fsck <path>
          [-list-corruptfileblocks |
          [-move | -delete | -openforwrite]
          [-files [-blocks [-locations | -racks | -replicaDetails | -upgradedomains]]]
          [-includeSnapshots] [-showprogress]
          [-storagepolicies] [-maintenance]
          [-blockId <blk_Id>]

sudo -u hdfs hdfs fsck / | grep 'Under replicated' | awk -F':' '{print $1}' > test.log

后台执行命令查看输出文件中会提示丢失快的统计和具体有问题的文件路径和名称。

如果文件不重要直接将文件块删除：

hdfs fsck -delete /tmp/hadoop-yarn/staging/yebowen/.staging/job_1537174906503_876513/job.xml

如果有备份也可以删除整个文件后重新复制一份到集群中：

hdfs dfs -rm -r /tmp/hadoop-yarn/staging/yebowen/.staging/job_1537174906503_876513/job.xml

3.如果文件重要
修复损坏文件：执行命令 hdfs debug recoverLease -path -retries eg：hdfs debug recoverLease -path /tmp/hadoop-yarn/staging/yebowen/.staging/job_1537174906503_876513/job.xml -retries 10