Ceph monitor故障恢复

本文详细介绍了Ceph监控节点(mon)在出现异常退出和超过半数节点挂掉时的故障恢复方法。包括通过重启mon进程、使用monmaptool恢复monmap、拷贝mon key等步骤,确保Ceph集群恢复正常运行状态。
摘要由CSDN通过智能技术生成
Ceph monitor故障恢复
查看ceph健康状态
[root@bgw-os-node151 ~]# ceph health
HEALTH_OK
[root@bgw-os-node151 ~]# ceph health detail
HEALTH_OK
[root@bgw-os-node151 ~]# ceph mon stat
e2: 3 mons at{bgw-os-node151=10.240.216.151:6789/0,bgw-os-node152=10.240.216.152:6789/0,bgw-os-node153=10.240.216.153:6789/0},election epoch 12, quorum 0,1,2 bgw-os-node151,bgw-os-node152,bgw-os-node153
故障一:Ceph mon进程异常退出且系统运行正常
故障错误信息
[root@bgw-os-node151 ~]# ceph health detail
HEALTH_WARN 1 mons down, quorum 0,1bgw-os-node151,bgw-os-node152
mon.bgw-os-node153 (rank 2) addr10.240.216.153:6789/0 is down (out of quorum)
解决办法
这类故障重启相应的mon进程即可恢复
[root@bgw-os-node153 ceph]# service ceph -c/etc/ceph/ceph.conf start mon.bgw-os-node153  
=== mon.bgw-os-node153 ===
Starting Ceph mon.bgw-os-node153 onbgw-os-node153...
Starting ceph-create-keys onbgw-os-node153...
[root@bgw-os-node153 ceph]# ps aux |grepmon
dbus     2215  0.0  0.0 21588  2448 ?        Ss  May08   0:00 dbus-daemon --system
root    18516  0.1  0.0 151508 15612 pts/0    Sl  14:57   0:00 /usr/bin/ceph-mon -ibgw-os-node153 --pid-file /var/run/ceph/mon.bgw-os-node153.pid -c/etc/ceph/ceph.conf --cluster ceph
root    18544  0.0  0.0 103308 2092 pts/0    S+   14:57  0:00 grep mon
[root@bgw-os-node153 ceph]# ceph healthdetail
HEALTH_OK

故障二:Ceph集群中有超过半数的mon进程挂掉
一般来说,在实际运行中,ceph monitor的个数是2n+1(n>=0)个&#
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值