目录
场景描述:
最近客户线上一个三节点集群,由于raid卡故障导致一个存储节点宕机,可能是raid卡突然故障导致ceph mon数据库文件丢失,ceph-mon无法启动,只能删掉重新创建
情况介绍:
可以看到集群只剩两个monitor
再次发生网络动荡的时候,两个monitor容易发生脑裂,所以需要尽快解决
操作步骤:
先随机生成五位字符来当作monitor ID
import random
mon_id = "".join(random.sample(string.ascii_lowercase, 5))
EG: "uoder"
创建Monitor流程
mon_id = "etfsc"
monmap = "/tmp/monmap"
mon_data_path = "/data/mon.etfsc"
cluster_ip = "10.10.10.168"
# 创建mon data path (如果path存在,需删除目录下所有文件,记得备份)
mkdir /data/mon.etfsc
# 获取 keyring
ceph auth get-or-create mon. -o /tmp/keyring
# 获取集群 monmap (10.10.10.163是集群mon leader ip)
ceph -m 10.10.10.163 mon getmap -o /tmp/monmap
# 创建 monitor
ceph-mon -i etfsc --mkfs --monmap /tmp/monmap --keyring /tmp/keyring
# 集群添加monitor
ceph mon add etfsc 10.10.10.168:6789
# 重启monitor服务
/etc/init.d/ceph restart mon
Monitor创建成功
查看集群健康状态
Monitor成功创建
thanks