记一次OOM Killer导致的生产事故

li644872790

于 2023-03-17 11:46:47 发布

阅读量314

点赞数

文章标签：服务器 linux 运维 java Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li644872790/article/details/129616698

版权

过程：

重启服务端某测试服务时，服务器内存配置大，导致系统内存溢出，服务重启失败，继续启动正常，但一核心程序被kill，且未察觉。

原因：系统内存溢出时导致系统触发oom killer，核心程序被优先杀死。

排查过程：

1. 检查被杀死程序日志，无异常（包括）。

2. 检查linux 系统日志：/var/log/messages ,这里会记录进程操作日志。

egrep -i 'killed process' /var.log.messages

注意：该文件只会记录近2天左右的日志

3. 发现有记录，触发过oom killer。

oom killer简析：

1. 给进程分配内存时发现内存不够会触发 oom killer

2. oom killer 会根据现有进程的综合评分进行kill，评分越高的越先被触发。

评分在对应线程的目录下查看：cat /proc/${PID}/oom_score

3. 我们可以通过修改 /proc/${PID}/oom_score_adj 来控制oom_score的值：oom_score的实际值是会在系统计算完成之后在加上oom_score_adj 来定的，可通过以下命令来设置oom_score_adj 从而减低oom_score值。

echo -20 > /proc/28530/oom_score_adj

注： -20 为动态值，可调整

解决方法：

1. 调整程序启动内存分配值，尽量留出富余。

2. 核心程序建议减低oom_score，避免被优先kill掉。

3. 我们也可以完全关闭OOM killer，但不推荐用在生产环境下关闭，执行如下操作：

[root@hadoopgateway ~]#sysctl -w vm.overcommit_memory=2

[root@hadoopgateway ~]# echo "vm.overcommit_memory=2" >> /etc/sysctl.conf

vm.overcommit_memory有0、1、2三个可选值，分别代表如下含义：

0：表示用户申请内存的时候，系统会判断剩余的内存多少，如果不够的话那么就会失败。

1：用户申请内存的时候，系统不进行任何内存是否够用的检查，直到使用内存超过可用内存。

2：用户一次申请的内存大小不允许超过可用内存的大小。

通过设置这个参数，即可达到关闭OOM killer，但是一般情况下不建议这么做，毕竟内存持续占用的场景不是很多，或者可以设置/proc/sys/vm/overcommit_memory为0，一般默认就是0，这样可以最大限度的避免系统触发OOM Killer。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
记一次OOM Killer导致的生产事故

程序突然消失的问题排查：OOM Killer
复制链接

扫一扫

li644872790 CSDN认证博客专家 CSDN认证企业博客

码龄10年

8: 原创

79万+: 周排名

226万+: 总排名

9459: 访问

: 等级

89: 积分

3: 粉丝

9: 获赞

2: 评论

23: 收藏

私信

关注

热门文章

分类专栏

mysql学习之深入原理剖析 4篇

最新评论

记一次线上磁盘报警引起关于文件句柄泄露问题排查
CSDN-Ada助手: 恭喜用户写了这篇有关文件句柄泄露问题排查的博客，这是一个非常实用的技术问题。建议用户在接下来的创作中，可以结合自己的经验和实践，分享更多的技术心得和解决方案，期待更多优质的博客。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
ES核心干货学习（原理及数据结构）
CSDN-Ada助手: 恭喜作者写出了这篇关于ES核心干货学习的博客，分享了原理及数据结构。这篇文章对于ES初学者来说非常有价值，讲解深入浅出，易于理解。建议作者在下一篇博客中可以深入探讨ES的应用场景，或者分享一些实战经验，让读者更好地了解ES的实际运用。感谢作者的分享，期待更多优质内容。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
记一次OOM Killer导致的生产事故
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。