linux内核中内存耗尽OOM killer

当Linux系统内存严重不足时,会触发OOM Killer来选择并杀死某些进程以释放内存。本文详细介绍了内核中oom_kill_process的执行流程,包括内存耗尽时的可配置参数、杀死进程的计算方法、技术原理,以及源码分析。通过计算进程的badness分数来决定哪个进程将被杀死,并讨论了如何避免内存泄露导致的OOM情况。此外,还探讨了内核如何处理有子进程的情况以及如何发送SIGKILL信号。
摘要由CSDN通过智能技术生成

   

目录

 工程实例

一、内存耗尽可配置的参数如下:

二、杀死进程的计算方法

三、技术原理

oom_kill_process执行过程

四、源码分析 


 工程实例

        当内存严重不足时,页分配器在多次尝试直接回收失败后,就会调用内存耗尽OOM killer,选择杀死进程,释放内存。

        先看一段oom 输出的错误

[ 7981.765805] kthreadd invoked oom-killer: gfp_mask=0x2dc2(GFP_KERNEL|__GFP_HIGHMEM|__GFP_NOWARN|__GFP_ZERO), order=0, oom_score_adj=0
[ 7981.777742] CPU: 3 PID: 2 Comm: kthreadd Tainted: G           O      5.4.0-xilinx-v2020.1 #1
[ 7981.786164] Hardware name: xlnx,zynqmp (DT)
[ 7981.790329] Call trace:
[ 7981.792767]  dump_backtrace+0x0/0x140
[ 7981.796415]  show_stack+0x14/0x20
[ 7981.799717]  dump_stack+0xac/0xd0

...

[ 7982.331629] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/,task=net_process,pid=1275,uid=0
[ 7982.344516] Out of memory: Killed process 1275 (net_process) total-vm:4113316kB, anon-rss:3888320kB, file-rss:36kB, shmem-rss:2052kB, UID:0 pgtables:7852032kB oom_score_adj:0
[ 7982.974247] oom_reaper: reaped process 1275 (net_process), now anon-rss:0kB, file-rss:0kB, shmem-rss:2052kB

在应用程序开发时会出现内存泄露,如上述所示,杀死net_process进程信息。在内核中是如何处理的呢?

一、内存耗尽可配置的参数如下:

/proc/sys/vm/oom_kill_allocating_task

        是否允许杀死正在申请分配内存并触发内存耗尽的进程,避免扫描进程链表选择进程。

        0表示禁止,非零表示允许

/proc/sys/vm/oom_dump_tasks

        是否允许内存耗尽杀死进程的时候,是否打印所有用户进程的内存使用信息,

        0表示禁止,非零表示允许

/proc/sys/vm/panic_on_oom

        是否允许在内存耗尽的时候内核panic,重启系统。

        0:表示禁止内核恐慌,1 表示允许内核恐慌;2强制执行内核恐慌

二、杀死进程的计算方法

        给进程计算分数(badness score),选择分数最高的进程。分数范围0~1000,0 表示不杀死,1000表示总是杀死。

  1. 用户可以在/proc/<pid>/oom_score_adj 为进程设置分数值范围[-1000,1000]。值越大导致杀死时的分数越高。
  2. 查看进程分数/proc/<pid>/oom_socre

三、技术原理

        内存耗尽杀手分为全局的内存耗尽杀手内存控制组的内存耗尽杀手

  1. 内存控制组的内存耗尽杀手指内存控制组的内存使用量超过硬限制的时候,内存控制组选择进程杀死。
  2. 全局的内存耗尽杀手是指内存严重不足的时候,从整个系统选择进程杀死。

oom_kill_process执行过程

  1. 如果被选中的进程有子进程,那么从所有子进程中选择badness score最高的子进程代替父进程牺牲,试图使丢失的工作量最小化。(在多进程的服务端场景)
  2. 向被选中的进程发送杀死信号SIGKILL

四、源码分析 

bool out_of_memory(struct oom_control *oc)
{
    unsigned long freed = 0;
    if (oom_killer_disabled)
        return false;
    if (!is_memcg_oom(oc)) {
        blocking_notifier_call_chain(&oom_notify_list, 0, &freed);
        if (freed > 0)
            /* Got some memory back in the last second. */
            return true;
    }
    /*
     * If current has a pending SIGKILL or is exiting, then automatically
     * select it.  The goal is to allow it to allocate so that it may
     * quickly exit and free its memory.
     */
    if (task_will_free_mem(current)) {
        mark_oom_victim(current);
        wake_oom_reaper(current);
        return true;
    }
    /*
     * The OOM killer does not compensate for IO-less reclaim.
     * pagefault_out_of_memory lost its gfp context so we have to
     * make sure exclude 0 mask - all other users should have at least
     * ___GFP_DIRECT_RECLAIM to get here. But mem_cgroup_oom() has to
     * invoke the OOM killer even if it is a GFP_NOFS allocation.
     */
    if (oc->gfp_mask && !(oc->gfp_mask & __GFP_FS) && !is_memcg_oom(oc))
        return true;
    /*
     * Check if there were limitations on the allocation (only relevant for
     * NUMA and memcg) that may require different handling.
     */
    oc->constraint = constrained_alloc(oc);
    if (oc->constraint != CONSTRAINT_MEMORY_POLICY)
        oc->nodemask = NULL;
    check_panic_on_oom(oc);
    if (!is_memcg_oom(oc) && sysctl_oom_kill_allocating_task &&
        current->mm && !oom_unkillable_task(current) &&
        oom_cpuset_eligible(current, oc) &&
        current->signal->oom_score_adj != OOM_SCORE_ADJ_MIN) {
        get_task_struct(current);
        oc->chosen = current;
        oom_kill_process(oc, "Out of memory (oom_kill_allocating_task)");
        return true;
    }
    select_bad_process(oc);//选择进程
    /* Found nothing?!?! */
    if (!oc->chosen) {//没有选择要杀死的的进程
        dump_header(oc, NULL);
        pr_warn("Out of memory and no killable processes...\n");
        /*
         * If we got here due to an actual allocation at the
         * system level, we cannot survive this and will enter
         * an endless loop in the allocator. Bail out now.
         */
        if (!is_sysrq_oom(oc) && !is_memcg_oom(oc))
            panic("System is deadlocked on memory\n");
    }
    //有选择的杀死的进程
    if (oc->chosen && oc->chosen != (void *)-1UL)
        oom_kill_process(oc, !is_memcg_oom(oc) ? "Out of memory" :
                 "Memory cgroup out of memory");
    return !!oc->chosen;
}

参考:
《深入理解linux内核》
《Linux内核深度解析》
《linux内核深度解析 (余华兵) 》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

为了维护世界和平_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值