openstack物理机nova状态为down的处理方法

物理机nova状态为down的处理思路

说明

在控制节点上查看所有物理机运行状态,如果有某台为down,先别急着去重启物理机,而是先排除是不是服务down了,如下图,就是虽然显示已经down了,但还能ssh过去。如果服务有问题,重启服务即可。
在这里插入图片描述

故障排除思路

1、先去web界面查看rabbitMq服务是不是正常的

在这里插入图片描述
如果rabbitmq出问题了,去该控制节点查看服务:systemctl status rabbitmq-server.service
(我这是正常的,所以是active,如果在web界面看到是故障的,这儿状态就并非active)
在这里插入图片描述
然后重启rabbitmq服务:systemctl restart rebbitmq-server(重启报错,看日志报错,可能是相关服务也出问题了,所以导致rabbitmq服务不能正常重启)
再次查看服务,状态是active即可:systemctl status rebbitmq-server
处理完毕后再去rabbitmq的web界面看,该控制节点状态已经正常。

2、查看状态为down的nova服务是否为active,不为active即服务有问题

如文章第一个图中 computer07状态为down,所我ssh到computer07查看nova服务:systemctl status openstack-nova-compute.service
(因为已经处理好了,所以现在看到是active)
(如果在控制节点服务为down,但这状态依然是active,依然直接重启)
在这里插入图片描述
重启nova服务(要ssh到状态为down的服务器上重启该服务):systemctl restart openstack-nova-compute.service
再次查看状态是否是active,为active即正常:systemctl status openstack-nova-compute.service

3、不是服务问题(不能ssh过去),则直接去管理口重启物理机即可。

rabbitmq掉了nova会down的原因

先来看看rabbitmq掉了nova会down的图(脚本跑的结果)
在这里插入图片描述
重启rabbitmq
在这里插入图片描述
再次查看,恢复正常
在这里插入图片描述
原因:比如上面 看到的是 computer07掉了,那么就登陆到computer07的控制台。 cd /etc/novacat nova.conf
找到oslo_messaging_rabbit,下面第一行rabbit_hosts,后面有ip,正常情况如下
在这里插入图片描述
在这里插入图片描述
正常情况这会有多个ip,如果掉了其中一个,不会影响。但如果只配置了一个rabbitmq节点ip,如果配置的那个rabbitmq服务掉了,那么该台服务器的nova状态也就是为 down状态了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

҉人间无事人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值