99%的人都不知道内存充足情况下也会触发OOM！

最新推荐文章于 2025-02-17 18:20:43 发布

qiubinwei

最新推荐文章于 2025-02-17 18:20:43 发布

阅读量1.7k

点赞数 18

分类专栏： Linux内核学习180天文章标签： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiubinwei/article/details/135573699

版权

Linux内核学习180天专栏收录该内容

30 篇文章

订阅专栏

【问题背景】

一台虚拟机crash，从物理机的日志看，触发了oom，于是把虚拟机给kill了，但是事后通过监控查看物理机上的内存空间是比较充足的，尚有40GB的可用内容。

那么问题来了，为什么明明内存足够，缺无法分配？

【问题服务器所在架构】

1台48C256GB的Intel x86服务器（开了超线程，实际为2个物理CPU，24core），在上面创建了两个虚拟机，每个虚拟机为提高性能，采用了vCPU绑核的方式进行了绑定，每个物理CPU（24C中配置23C）对应一个虚拟机。虚拟化采用了qemu-kvm的技术。故每台虚拟机的配置为23C120GB。

【报错日志分析】

oom日志分析

第一段：qemu-kvm需要申请内存，但是发现内存不够，于是触发了oom，触发本次oom的进程PID为2905469.

相应的调用函数为从下往上：

page_fault -> do_page_fault ->...->oom_kill_process->...->dump_stack

汇总当前节点的内存使用情况，Node 1上空余内存为40MB。

开始对当前系统的进程进行排序，最终选择score分数为782（最高）的进程pid 2905469作为第一个释放的pid进行killed。

也就是自己杀死了自己。GG

【寻找蛛丝马迹】

翻了一下numa架构，正常情况下，numa架构下，应该有Node0和Node1两个内存节点，每个内存节点128GB。

正常情况下，即便是进程绑定了CPU，也是代表说CPU优先使用对应NODE中的内存空间，一旦该NODE的内存空间不足了，就会使用另外一个NODE的内存。

然而在本次的oom过程中，只有收集了NODE 1的free内存。并没有手机NODE 0的free内存。这一点也就是事后为什么在监控上还能看到物理机内存剩余空间比较大的原因。这部分free的内存实际来源于NODE 0。

从oom的日志来看，应该是这台虚拟机的配置存在一些特殊情况导致了内存只在NODE 1中进行分配。

进一步分析虚拟机的xml文件，看到有如下配置：

<numatune>    <memory mode="strict" nodeset="1"/>  </numatune>

【根因分析】

numatune是libvirt的一个参数，可以用在numa架构的host上，以控制虚拟机的内存访问策略。

numatune的mode选项有：

strict：默认的策略，如果值指定的node上无法分配内存，则虚拟机
interleave：通过轮询方式，在指定的多个node上分配内存
preferred：优先在指定node上分配内存，如果内存不足，允许在其他node上分配内存

由此，可以看到当前服务器上的xml配置为nodeset=1且mode为strict，因此虚拟机只能使用NODE1上面的内存，也就是128GB，一旦128GB用完了，那么这个虚拟机将无足够的内存使用。

虽然两个虚拟机分别绑定了两个不同的内存NODE，但是除了虚拟机之外，操作系统上还有其他的openstack进程和系统进程也会使用内存，而且分布可能不均衡，因此在长期的运行下，随着内存实际使用率越来越高，最终触发了OOM。

【衍生阅读】

内存页面分配-快速路径http://mp.weixin.qq.com/s?__biz=MzU0MjYxMjIxMg==&mid=2247484209&idx=1&sn=0b859c80604d3f52712f53f038e17b52&chksm=fb194caacc6ec5bc454b796e0fe1adb43e6d7acd2b7feea205b50cb7903856e28ce80926dd4b&scene=21#wechat_redirect

内存页面分配-慢速路径http://mp.weixin.qq.com/s?__biz=MzU0MjYxMjIxMg==&mid=2247484236&idx=1&sn=b5553a9b24885a9f230be9bb567456fd&chksm=fb194cd7cc6ec5c13d648e26777077b416095fb05d4555402be19bf62bc7024c7f4bb9afbf5e&scene=21#wechat_redirect

内存水位管理和分配优先级http://mp.weixin.qq.com/s?__biz=MzU0MjYxMjIxMg==&mid=2247484242&idx=1&sn=a8f59744b76fed4180cee3830f45d96b&chksm=fb194cc9cc6ec5dfd30f0cc9d32e3dd93fce2c49758a0a2dfc4ab6ba30967db238db8acf2da7&scene=21#wechat_redirect

博客等级

码龄18年

41
原创

148
点赞

141
收藏

106
粉丝

关注

私信

热门文章

分类专栏

最新评论

99%的人都不知道的ssh访问缓慢原因
Supergirl: 请问具体是哪个pam参数呢？
Day0-学习计划
CSDN-Ada助手: 恭喜你开始博客创作！标题“Day0-学习计划”让我感到非常期待你未来的博客内容。通过设立学习计划，你展示了你对学习的认真态度和追求进步的决心。接下来，我建议你在博客中详细介绍你的学习计划，包括具体的学习目标和计划的执行方式。这样一来，读者们将更好地了解你的学习过程，并能从中获得启发和帮助。期待你的下一篇博客！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Day1-Falg+内核发展
CSDN-Ada助手: 非常棒的博客！很高兴看到你重新开始学习内核开发，并且对Linux内核有着一定的想法。学习内核确实是一项具有挑战性的任务，但是我相信你一定能够克服困难，取得进步。除了传统的宏内核和基于多内核的操作系统，还有一些其他与内核相关的扩展知识和技能，可以进一步丰富你的学习内容。例如，你可以了解一下微内核(Microkernel)的概念，它将大部分的操作系统功能移出内核，使得内核更加精简和可靠。此外，还可以深入了解虚拟化技术和容器化技术，它们在现代操作系统和云计算领域有着广泛的应用。希望你能够坚持下去，持续创作。相信随着学习的深入，你会逐渐掌握内核开发的技巧和思维方式。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Day2.进程管理1
CSDN-Ada助手: 恭喜你写了第三篇博客！标题“Day2.进程管理1”听起来非常有趣。看来你对进程管理有一定的了解了。希望你能继续保持创作的热情，不断分享你的学习心得和经验。在下一篇博客中，也许你可以深入探讨一些进程管理的实际应用案例，或是与其他相关主题进行结合，这样读者们可以更好地理解进程管理的重要性和实际运用。期待你的下一篇博客，继续加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Day3.进程与线程的基本概念
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“Day3.进程与线程的基本概念”非常吸引人。您在这篇博客中解释了进程与线程的基本概念，让读者对这两个概念有了更清晰的理解。我很高兴看到您持续创作，并努力分享知识。作为下一步的创作建议，我认为您可以考虑进一步探索进程与线程的具体应用场景，或者深入分析它们之间的异同之处。这样的深入研究将有助于读者更好地理解它们在实际开发中的作用和优劣势。同时，也希望您能够保持谦虚的态度，继续努力提升自己的写作技巧和知识水平。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。