StudyOverseas大佬:
原文:https://www.liujason.com/article/565.html
今天下午一个pve集群出了点问题,排查修复了。还是那句话,希望各位不要碰到,碰到了看看能省不少时间。
问题描述
Proxmox集群单节点丢失,能够ping通,但是ssh通过key连接时卡住,使用密码正常。
使用ssh -vvv查看发现在验证key的时候无任何反馈,表明故障节点存public key的地方出现了问题。
排查
Proxmox存储集群public key的地方在/etc/pve,尝试cd进入失败。
/etc/pve路径使用的是corosync进行同步,查看状态无异常,能看到5个pve节点:
root@PVE-EU-2 ~ # systemctl status corosync
● corosync.service – Corosync Cluster Engine
Loaded: loaded (/lib/systemd/system/corosync.service; enabled; vendor preset: enabled
Active: active (running) since Sun 2020-02-23 11:06:37 CET; 2min 55s ago
Docs: man:corosync
man:corosync.conf
man:corosync_overview
Main PID: 23596 (corosync)
Tasks: 9 (limit: 4915)