ceph集群销毁卡住问题分析

ceph集群销毁时,对ceph文件系统进行了umount,然后调用sgdisk -o清除分区信息,由于umount没有成功,导致sgdisk线程被卡住,原因是:
下图umount线程3384374调用的deactivate_super函数占用了读写锁的写锁:down_write(&s->s_umount);
而线程3544214调用的iterate_super函数将要申请读写锁的读锁:down_write(&s->s_umount);
由于写锁具有排他性,读锁将申请不到。所以所有尝试执行的sgdisk都进入D状态。

umount没有成功原因:
因为page cache中有个page正在回写(PG_writeback),即存在其他线程还在使用该ceph文件系统,该umount操作只有等待该page回写完成才能成功。所以销毁前需要保证所有连接该文件系统的客户端(nfs,ssh等)都要停掉,所以集群重启下再做销毁方可成功。

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值