目录
oom_adj是什么
oom_adj 是一个打分因子, 取值范围 -17到 15。 取值 -17 这个进程就永远杀不掉了
oom_score_adj是什么
oom_score_adj 也是一个打因子,取值范围 -1000 到 1000。取值 -1000 这个进程也是永远杀不掉。
oom_adj和oom_score_adj关系
在内核里表现其实只有oom_score_adj,那 oom_adj有什么用呢? 当写入oom_adj时会通过oom_adj这个系数计算出oom_score_adj。
计算流程:
if (oom_adj == OOM_ADJUST_MAX) 如果 oom_adj 是 -17 则 oom_adj = -1000
oom_adj = OOM_SCORE_ADJ_MAX;
else
oom_adj = (oom_adj * OOM_SCORE_ADJ_MAX) / -OOM_DISABLE; 否则 oom_adj 等于 (oom_ajd * 1000)/17, 这个直接就是整型的除法,去掉小数了,会导致输入和输出可能不一致,后面有讲到
if (oom_adj < task->signal->oom_score_adj &&
!capable(CAP_SYS_RESOURCE)) { 在这里判断下权限,如果oom_adj小于上次的值,会判断当前用户的权限。
err = -EACCES; 如果是非root用户,则直接返回没有 EACCESS,表示没有权限
goto err_sighand;
}
task->signal->oom_score_adj = oom_adj; 把上面算到的oom_adj 赋值给 oom_score_adj
为什么写入的oom_adj和获取的oom_adj不一致:
这个要看到oom_adj是如何读取的
if (task->signal->oom_score_adj == OOM_SCORE_ADJ_MAX) 如果oom_score_adj == 1000, oom_adj直接等于 15
oom_adj = OOM_ADJUST_MAX;
else
oom_adj = (task->signal->oom_score_adj * -OOM_DISABLE) / 否则 oom_adj = oom_score_adj * 17 / 1000
OOM_SCORE_ADJ_MAX; 之前的oom_score_adj = (oom_adj * 1000) / 17
看这两个基本就是反转的关系,但是因为是整型除,并且oom_adj没有17的倍数,所以基本上只要输入一个oom_adj,在输出的oom_adj都会减了,但是不会影响oom_score_adj.
通过以上分析,oom_adj有减少不要奇怪,关注oom_score_adj就好了。
进程如何打分
打分points,主要是badness。
adj = (long)p->signal->oom_score_adj;
if (adj == OOM_SCORE_ADJ_MIN) { oom_score_adj == -1000 则直接 返回 0,及打分为0,分数等于0基于上就是不会被OOM
task_unlock(p);
return 0;
}
points = get_mm_rss(p->mm) + atomic_long_read(&p->mm->nr_ptes) +
get_mm_counter(p->mm, MM_SWAPENTS);
points = 驻留内存 + 进程占用的page数+占用的swap内存
task_unlock(p);
/*
* Root processes get 3% bonus, just like the __vm_enough_memory()
* implementation used by LSMs.
*/
if (has_capability_noaudit(p, CAP_SYS_ADMIN)) 如果是root用户,则 points 减去 3%。
points -= (points * 3) / 100;
/* Normalize to oom_score_adj units */
points += adj; oom_score_adj 会加到 points上
通过以上代码可以确定给每个进程打分取决于,驻留内存, pagetable和swap的使用,
root用户的进程会减去3%的分数
oom_score_adj 最终会加到打分的上面去。
oom怎么判断
遍历所有进程,判断哪个得分最高,就杀掉。
oom 不同的linux差不多,有个别小项可能不一样。 以上代码基于 3.10.0-32