问题现象
在下面这张图中我们可以看到有一个Compute是Down的。
这个时候的第一印象是Compute的挂掉了。但是检查的时候有时会发现Compute并没有挂掉,nova-compute服务也跑的好好的。
问题分析
这个情况基本上是由于时间不同步导致的。
在/etc/nova.conf中有如下配置,默认的service_down_time是60秒。
# Maximum time since last check-in for up service (integer value)
# service_down_time=60
在nova.servicegroup.drivers.db中有如下处理用于判断服务的状态是up还是down的。
class DbDriver(base.Driver):
def __init__(self