我的容器为啥被杀屎了?
Linux 允许进程在申请内存的时候是 overcommit 的,也就是说允许进程申请超过实际物理内存上限的内存。(超卖)
因为 malloc() 申请的是内存的虚拟地址,系统只是给了程序一个地址范围,由于没有写入数据,所以程序并没有得到真正的物理内存。物理内存只有程序真的往这个地址写入数据的时候,才会分配给程序。可以看得出来,这种 overcommit 的内存申请模式可以带来一个好处,它可以有效提高系统的内存利用率。
当遇到内存不够的这种情况,Linux 采取的措施就是杀死某个正在运行的进程。(OOM)
- 问:在发生 OOM 的时候,Linux 到底是根据什么标准来选择被杀的进程呢?
- 答:在 Linux 内核里有一个 oom_badness() 函数定义了选择进程的标准。其实这里的判断标准也很简单,函数中涉及两个条件:
- 进程已经使用的物理内存页面数。
- 每个进程的 OOM 校准值 oom_score_adj。在 /proc 文件系统中,每个进程都有一个 /proc/[pid]/oom_score_adj 的接口文件。我们可以在这个文件中输入 -1000 到 1000 之间的任意一个数值,调整进程被 OOM Kill 的几率。
用系统总的可用页面数,乘以 OOM 校准值 oom_score_adj,再加上进程已经使用的物理页面数,计算出来的值越大,那么这个进程被 OOM Kill 的几率也就越大。
- Memory Cgroup 的虚拟文件系统的挂载点一般在"/sys/fs/cgroup/memo