/etc/init.d/openstack-nova-novncproxy status
openstack-nova-novncproxy dead but pid file exists
由于没有日志,无法查看具体原因。直接配置log-file对应这个进程似乎没有效果,因此采用手动起进程方式,将日志重定向的ttx.log。
nohup /usr/bin/nova-novncproxy --web /usr/share/novnc/ >> ttx.log &
半天之后,发现控制台仍然登录不进去,查看日志log,发现出现如下log 异常:
{</usr/lib/python2.6/site-packages/amqp/channel.py:608: DeprecationWarning: auto_delete exchanges has been deprecated
'auto_delete exchanges has been deprecated'))
138: 192.168.10.100: Plain non-SSL (ws://) WebSocket connection
138: 192.168.10.100: Version hybi-13, base64: 'True'
138: 192.168.10.100: Path: '/websockify'
138: handler exception: Invalid Token
138: Traceback (most recent call last):
File "/usr/lib/python2.6/site-packages/websockify/websocket.py", line 711, in top_new_client
self.new_client()
File "/usr/lib/python2.6/site-packages/nova/console/websocketproxy.py", line 56, in new_client
raise Exception(_("Invalid Token"))
Exception: Invalid Token
|
按照异常直接跟踪代码:
vim /usr/lib/python2.6/site-packages/nova/console/websocketproxy.py
if not connect_info:
LOG.audit("Invalid Token: %s", token)
raise Exception(_("Invalid Token"))
|
发现上述语句出现异常,因此试验强制抛出异常,监测是否该异常会导致novnc进程挂掉。
前台显示启动:
/usr/bin/nova-novncproxy --web /usr/share/novnc/
发现只要raise一抛,novnc则登录不上去。
因为找到了导致novnc自动死掉的地方,具体为什么报Invalid Token异常,请自行跟踪代码:
当然最简单的办法就是直接把异常语句屏蔽掉。(当然不赞同,毕竟最好还是找到为什么抛异常的原因)
后续试验一段时间,发现该错误继续重现,
经过排查试验,最后得出结论:
1、由于/etc/init.d/openstack-nova-novncproxy stop时候,
每次只将第一个进程kill掉(有时候是重启/etc/init.d/openstack-nova-console)
2、而页面没点击一个控制台链接就会对应多个进程
所以每次只是kill掉第一个进程的话,其他进程并没有重启,这样导致界面的控制台登录出错
且后面查看
/etc/init.d/openstack-nova-novncproxy staus时候,是novncproxy dead but pid file exists
最终解决办法是:将vim /etc/init.d/openstack-nova-novncproxy
将stop的逻辑修改下,将所有的novnc进程全部kill掉。(其实在start时候只记录了一个pid号)