#Ceph Version: 10.2.10
#OS: ubutnu 16
1.e7 not in monmap and have been in a quorum before; must have been removed
集群一个节点失联后打算换个机器重新发布 ip相同 hostname不同
一直的做法是在ceph-deploy节点上
修改ceph.conf 改为新的节点Hostname
ceph-deploy --overwrite-conf mon create-initial
结果这次发现怎么也起不来
重启所有节点都不行
ceph mon stat
发现quorum还是之前的hostname也就是monmap没有更新
于是
ceph mon remove
ceph mon add
monmaptool balabala
重新在该节点和其他节点查看monmap
发现就算monmap改为最新的了 但是该节点monitor仍然起不起来:
e7 not in monmap and have been in a quorum before; must have been removed
因为当前已经是e8
怀疑该节点由于之前的monmap错误可能会有数据残留 仍然处于原来的状态
遂尝试
ceph mon force sync --i-know-what-i-do (i am not sure)
ceph mon scrub
均无效
mv /var/lib/ceph/mon/ceph-node/store.db /tmp
结果直接报没有文件夹的错误 虽然他自己会创建文件夹 但是可能缺少了key文件(猜测是manifest)仍然会报该错误 PS:错误中提到了create_if_missing = false 可能可以在ceph.conf的【mon】中配置,未尝试
怒,遂重新发布该节点monitor
ceph-deploy mon destroy <nodeName>
ceph-deploy add <nodeName> <ip:port>
该monitor启动成功