k8s重启Exit Code: 137;Reason: OOMKilled

文章讲述了在Kubernetes(K8s)环境中,服务因持续重启的问题。起初怀疑是模型下载导致内存溢出,但调整下载逻辑后问题依旧。通过`kubectldescribepodpodname`命令检查发现,服务因OOMKilled(内存不足)退出,退出代码137指示内存限制过小。解决方案是增大yaml配置文件中的内存限制,调整后服务暂时未再重启。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题:发现部署到k8s上的服务一直在自动重启。

一开始以为是程序中下载的训练模型太大了,每天都下载一遍模型并且不会删除,导致内存溢出服务挂掉然后重启。后来修改了模型下载逻辑,观察之后还是会不停重启。

网上看到有人说可能是服务部署设置的问题,使用命令

kubectl describe pod  podname(写想查看的pod的name)

可以看到服务的详细信息

 发现原因:红框里的信息OOMKilled,退出的提示码是137,经过查询发现是部署服务时的yaml文件里的限制内存写的有点小,简单来说就是:你运行项目需要的内存比你设置的内存大,在你运行项目的时候申请内存超过了你限制的内存就会报错退出,然后重启。

 在自己文件中把这个改大了一些,观察了一段时间,暂时还没有遇到重启。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值