上周上线完之后,平台频繁出现问题,从服务器查看pod状态为Running
但是从日志中查看就是直接被killed
检查过nginx日志、数据库等未发现异常
由上图可以看出最后直接就是被killed
下意识的我会以为是程序运行超过了所指定的Xmx参数,但是平台运行的情况我还是了解的,之前即便访问量大的是的也是个别服务或者数据库压力大,不会导致这两天无规律性质的死掉服务,几乎什么服务都可能会进行被killed
我尝试调整过启动脚本Xmx参数 但是没用,一样还是会被killed
之前也处理过关于pod启动异常的问题,然后我去检查各个节点运行资源情况:
free -h #查看运行内存
df -h #查看磁盘空间
top #查看CPU