Android进程系列第六篇---LowmemoryKiller机制分析(上)

内容预览

二、概述

前面进程系列已经更新了五篇,本文(基于Android O源码),梳理LMK杀进程机制上篇,主要总结AMS和LowmemoryKiller通信的方式以及LowmemoryKiller的原理。
Android进程系列第一篇---进程基础
Android进程系列第二篇---Zygote进程的创建流程
Android进程系列第三篇---SystemServer进程的创建流程
Android进程系列第四篇---SystemServer进程的启动流程
Android进程系列第五篇---应用进程的创建流程

1、为什么引入LowmemoryKiller?
进程的启动分冷启动和热启动,当用户退出某一个进程的时候,并不会真正的将进程退出,而是将这个进程放到后台,以便下次启动的时候可以马上启动起来,这个过程名为热启动,这也是Android的设计理念之一。这个机制会带来一个问题,每个进程都有自己独立的内存地址空间,随着应用打开数量的增多,系统已使用的内存越来越大,就很有可能导致系统内存不足。为了解决这个问题,系统引入LowmemoryKiller(简称lmk)管理所有进程,根据一定策略来kill某个进程并释放占用的内存,保证系统的正常运行。

2、 LMK基本原理?
所有应用进程都是从zygote孵化出来的,记录在AMS中mLruProcesses列表中,由AMS进行统一管理,AMS中会根据进程的状态更新进程对应的oom_adj值,这个值会通过文件传递到kernel中去,kernel有个低内存回收机制,在内存达到一定阀值时会触发清理oom_adj值高的进程腾出更多的内存空间,这就是Lowmemorykiller工作原理。

3、LMK基本实现方案
所以根据不同手机的配置,就有对应的杀进程标准,这个标准用minfree和adj两个文件来定义:

/sys/module/lowmemorykiller/parameters/minfree:里面是以","分割的一组数,每个数字代表一个内存级别。
/sys/module/lowmemorykiller/parameters/adj:对应上面的一组数,每个数组代表一个进程优先级级别

用小米note3举例:

wangjing@wangjing-OptiPlex-7050:~$ adb root
restarting adbd as root
wangjing@wangjing-OptiPlex-7050:~$ adb shell
jason:/ # cat /sys/module/lowmemorykiller/parameters/minfree
18432,23040,27648,32256,55296,80640
jason:/ # 
jason:/ # cat /sys/module/lowmemorykiller/parameters/adj
0,100,200,300,900,906
jason:/ # 

minfree中数值的单位是内存中的页面数量,一般情况下一个页面是4KB,当内存低于80640的时候,系统会杀死adjj>=906级别的进程,当内存低于55296的时候,系统会杀死adj>=900级别的进程。不同配置的机器这两个文件会有区别,我把minfree文件中的值理解成五个水位线,而adj这个文件中的值与minfree文件中的数值一一对应,意味着到达什么样的水位线,杀死对应数值的进程。

对于应用进程来说,也需要有自身的adj,由AMS负责更新。定义在oom_adj和oom_score_adj文件中:
/proc/pid/oom_adj:代表当前进程的优先级,这个优先级是kernel中的优先级。
/proc/pid/oom_score_adj:这个是AMS上层的优先级,与ProcessList中的优先级对应

比如查看一下头条进程的adj值,如下:

jason:/ # ps -ef |grep news                                                                                                                                                                                
u0_a159       7113  1119 8 15:21:12 ?     00:00:11 com.ss.android.article.news
u0_a159       7188  1119 0 15:21:12 ?     00:00:00 com.ss.android.article.news:ad
u0_a159       7299  1119 1 15:21:16 ?     00:00:02 com.ss.android.article.news:push
u0_a159       7384  1119 1 15:21:17 ?     00:00:00 com.ss.android.article.news:pushservice
root          7838  6429 3 15:23:35 pts/0 00:00:00 grep news
jason:/ # cat proc/7113/oom_adj                                                                                                                                                                            
0
jason:/ # cat proc/7113/oom_score_adj                                                                                                                                                                      
0
jason:/ # cat proc/7113/oom_adj                                                                                                                                                                            
12
jason:/ # cat proc/7113/oom_score_adj                                                                                                                                                                      
700
jason:/ # 

当头条位于前台进程的时候oom_adj值为0,oom_score_adj值也是0,当退出成为后台进程的时候,oom_adj值为12,oom_score_adj值是700。

其实oom_adj与oom_score_adj这两个值是有换算关系的。

kernel/drivers/staging/android/lowmemorykiller.c
271static short lowmem_oom_adj_to_oom_score_adj(short oom_adj)
272{
273 if (oom_adj == OOM_ADJUST_MAX)
274     return OOM_SCORE_ADJ_MAX;
275 else
276     return (oom_adj * OOM_SCORE_ADJ_MAX) / -OOM_DISABLE;
277}

其中OOM_ADJUST_MAX=-15,OOM_SCORE_ADJ_MAX=1000,OOM_DISABLE=-17,那么换算就是:oom_score_adj=12*1000/17=700。高版本的内核都不在使用oom_adj,而是用oom_score_adj,oom_score_adj是一个向后兼容。

综上总结一下LMK的基本原理,如下

用户在启动一个进程之后,通常伴随着启动一个Activity游览页面或者一个Service播放音乐等等,这个时候此进程的adj被AMS提高,LMK就不会杀死这个进程,当这个进程要做的事情做完了,退出后台了,此进程的adj很快又被AMS降低。当需要杀死一个进程释放内存时,一般先根据当前手机剩余内存的状态,在minfree节点中找到当前等级,再根据这个等级去adj节点中找到这个等级应该杀掉的进程的优先级, 之后遍历所有进程并比较进程优先级adj与优先级阈值,并杀死优先级低于阈值的进程,达到释放内存的目的。本文不讨论adj的计算,只讨论lmk原理。

三、LowmemoryKiller机制剖析

总的来说,Framework层通过调整adj的值和阈值数组,输送给kernel中的lmk,为lmk提供杀进程的原材料,因为用户空间和内核空间相互隔离,就采用了文件节点进行通讯,用socket将adj的值与阈值数组传给lmkd(5.0之后不在由AMS直接与lmk通信,引入lmkd守护进程),lmkd将这些值写到内核节点中。lmk通过读取这些节点,实现进程的kill,所以整个lmk机制大概可分成三层。

3.1、Framework层

AMS中与adj调整的有三个核心的方法,如下

  • AMS.updateConfiguration:更新窗口配置,这个过程中,分别向/sys/module/lowmemorykiller/parameters目录下的minfree和adj节点写入相应数值;

  • AMS.applyOomAdjLocked:应用adj,当需要杀掉目标进程则返回false;否则返回true,这个过程中,调用setOomAdj(),向/proc/pid/oom_score_adj写入oom_adj 后直接返回;

  • AMS.cleanUpApplicationRecordLocked & AMS.handleAppDiedLocked:进程死亡后,调用remove(),直接返回;

3.1.1、 AMS.updateConfiguration

   public boolean updateConfiguration(Configuration values) {
       synchronized(this) {
           if (values == null && mWindowManager != null) {
               // sentinel: fetch the current configuration from the window manager
               values = mWindowManager.computeNewConfiguration(DEFAULT_DISPLAY);
           }

           if (mWindowManager != null) {
               // Update OOM levels based on display size.
               mProcessList.applyDisplaySize(mWindowManager);
           }
        .....
       }
   }

mProcessList是ProcessList对象,调用applyDisplaySize方法,基于屏幕尺寸,更新LMK的水位线

/frameworks/base/services/core/java/com/android/server/am/ProcessList.java
198    void applyDisplaySize(WindowManagerService wm) {
199        if (!mHaveDisplaySize) {
200            Point p = new Point();
201            // TODO(multi-display): Compute based on sum of all connected displays' resolutions.
202            wm.getBaseDisplaySize(Display.DEFAULT_DISPLAY, p);
203            if (p.x != 0 && p.y != 0) {
                     //传入屏幕的尺寸
204                updateOomLevels(p.x, p.y, true);
205                mHaveDisplaySize = true;
206            }
207        }
208    }

传入屏幕的尺寸更新水位线,逻辑很简单

210    private void updateOomLevels(int displayWidth, int displayHeight, boolean write) {
211        // Scale buckets from avail memory: at 300MB we use the lowest values to
212        // 700MB or more for the top values.
213        float scaleMem = ((float)(mTotalMemMb-350))/(700-350);
214
215        //根据屏幕大小计算出scale
216        int minSize = 480*800;  //  384000
217        int maxSize = 1280*800; // 1024000  230400 870400  .264
218        float scaleDisp = ((float)(displayWidth*displayHeight)-minSize)/(maxSize-minSize);
            //google代码就是这么写的,表示不好评价了
219        if (false) {
220            Slog.i("XXXXXX", "scaleMem=" + scaleMem);
221            Slog.i("XXXXXX", "scaleDisp=" + scaleDisp + " dw=" + displayWidth
222                    + " dh=" + displayHeight);
223        }
224
225        float scale = scaleMem > scaleDisp ? scaleMem : scaleDisp;
226        if (scale < 0) scale = 0;
227        else if (scale > 1) scale = 1;
228        int minfree_adj = Resources.getSystem().getInteger(
229                com.android.internal.R.integer.config_lowMemoryKillerMinFreeKbytesAdjust);
230        int minfree_abs = Resources.getSystem().getInteger(
231                com.android.internal.R.integer.config_lowMemoryKillerMinFreeKbytesAbsolute);
232        if (false) {
233            Slog.i("XXXXXX", "minfree_adj=" + minfree_adj + " minfree_abs=" + minfree_abs);
234        }
235
236        final boolean is64bit = Build.SUPPORTED_64_BIT_ABIS.length > 0;
237       //通过下面的运算,将mOomMinFreeLow和mOomMinFreeHigh经过运算
         // 最后得出的 值存入mOomMinFree中,而如何计算这个值,是根据当前屏幕的分辨率和内存大小来
238        for (int i=0; i<mOomAdj.length; i++) {
239            int low = mOomMinFreeLow[i];
240            int high = mOomMinFreeHigh[i];
241            if (is64bit) {
242                // 64-bit机器会high增大
243                if (i == 4) high = (high*3)/2;
244                else if (i == 5) high = (high*7)/4;
245            }
246            mOomMinFree[i] = (int)(low + ((high-low)*scale));
247        }
              .......
287
288        if (write) {
289            ByteBuffer buf = ByteBuffer.allocate(4 * (2*mOomAdj.length + 1));
290            buf.putInt(LMK_TARGET);
291            for (int i=0; i<mOomAdj.length; i++) {
292                buf.putInt((mOomMinFree[i]*1024)/PAGE_SIZE);//五个水位线
293                buf.putInt(mOomAdj[i]);//与上面水位线对应的五个adj数值
294            }
295            //将AMS已经计算好的值通过socket发送到lmkd
296            writeLmkd(buf);
297            SystemProperties.set("sys.sysctl.extra_free_kbytes", Integer.toString(reserve));
298        }
299        // GB: 2048,3072,4096,6144,7168,8192
300        // HC: 8192,10240,12288,14336,16384,20480
301    }

这里携带的命令协议是LMK_TARGET,它对应到kernel里面执行的函数是cmd_target,要求kernel干的事情就是更新两面两个文件

/sys/module/lowmemorykiller/parameters/minfree
/sys/module/lowmemorykiller/parameters/adj

这两个文件的作用我已经在开头说过了,我把minfree文件中的值理解成五个水位线,而adj这个文件中的值与minfree文件中的数值一一对应,意味着到达什么样的水位线,杀死对应数值的进程。而AMS里面就是通过调用applyDisplaySize方法,基于屏幕尺寸以及机器的CPU位数,更新LMK的水位线的。

3.1.2、 AMS.applyOomAdjLocked

在看applyOomAdjLocked方法,这个方法的作用是应用adj,这个过程中,调用setOomAdj(),向/proc/pid/oom_score_adj写入oom_adj 后直接返回;系统中更新adj的操作很频繁,四大组件的生命周期都会影响着adj的值。而更新adj一般由applyOomAdjLocked完成。在看代码之前,在回温一下AMS中adj的定义,Android M与之后的adj定义有所区别。

 
Android M
 
Android M之后

可以看到M之后的adj数值变大的,为什么呢

 
image.png
 

因为这样adj可以更加细化了,即使相同进程,不同任务栈的adj也可以不一样。从Android P开始,进一步细化ADJ级别,增加了VISIBLE_APP_LAYER_MAX(99),是指VISIBLE_APP_ADJ(100)跟PERCEPTIBLE_APP_ADJ(200)之间有99个槽,则可见级别ADJ的取值范围为[100,199]。 算法会根据其所在task的mLayerRank来调整其ADJ,100加上mLayerRank就等于目标ADJ,layer越大,则ADJ越小。

再次科普一下,我们可以用下面的两个办法随时查看adj的值 。

1、cat proc/<pid>/oom_score_adj
2、adb shell dumpsys activity o/p

好了,现在来看AMS调用applyOomAdjLocked更新adj。

/frameworks/base/services/core/java/com/android/server/am/ActivityManagerService.java
22000    private final boolean applyOomAdjLocked(ProcessRecord app, boolean doingAll, long now, long nowElapsed) {
             .........
22009
22010        if (app.curAdj != app.setAdj) {
                    //之前的adj不等于计算的adj,需要更新
22011            ProcessList.setOomAdj(app.pid, app.uid, app.curAdj);
22012            if (DEBUG_SWITCH || DEBUG_OOM_ADJ || mCurOomAdjUid == app.info.uid) {
22013                String msg = "Set " + app.pid + " " + app.processName + " adj "
22014                        + app.curAdj + ": " + app.adjType;
22015                reportOomAdjMessageLocked(TAG_OOM_ADJ, msg);
22016            }
22017            app.setAdj = app.curAdj;
22018            app.verifiedAdj = ProcessList.INVALID_ADJ;
22019        }
                .........
22020
}
/frameworks/base/services/core/java/com/android/server/am/ProcessList.java
630    public static final void setOomAdj(int pid, int uid, int amt) {
631        if (amt == UNKNOWN_ADJ)
632            return;
633
634        long start = SystemClock.elapsedRealtime();
635        ByteBuffer buf = ByteBuffer.allocate(4 * 4);
636        buf.putInt(LMK_PROCPRIO);
637        buf.putInt(pid);
638        buf.putInt(uid);
639        buf.putInt(amt);
              //将AMS已经计算好的adj值通过socket发送到lmkd
640        writeLmkd(buf);
641        long now = SystemClock.elapsedRealtime();
642        if ((now-start) > 250) {
643            Slog.w("ActivityManager", "SLOW OOM ADJ: " + (now-start) + "ms for pid " + pid
644                    + " = " + amt);
645        }
646    }

这里携带的命令协议是LMK_PROCPRIO,对应kernel里面cmd_procprio函数,要求kernel干的事情是---把AMS发送过来的adj值更新到下面的文件中去。这样内存紧张的时候,LMK就会遍历内核中进程列表,杀死相应adj的进程了。

3.1.3、 AMS.cleanUpApplicationRecordLocked & AMS.handleAppDiedLocked

进程死掉后,会调用该进程的ProcessList.remove方法,也会通过Socket通知lmkd更新adj。

/frameworks/base/services/core/java/com/android/server/am/ProcessList.java
651    public static final void remove(int pid) {
652        ByteBuffer buf = ByteBuffer.allocate(4 * 2);
653        buf.putInt(LMK_PROCREMOVE);
654        buf.putInt(pid);
655        writeLmkd(buf);
656    }

这里携带的命令协议是LMK_PROCREMOVE,对应kernel里面的cmd_procremove函数,要求kernel干的事情是,当进程死亡了,删除/proc/<pid>下面的文件。

上面三大方法最后都是通过writeLmkd与lmkd通信,现在看看writeLmkd中怎么和lmkd通信的,首先需要打开与lmkd通信的socket,lmkd创建名称为lmkd的socket,节点位于/dev/socket/lmkd

658    private static boolean openLmkdSocket() {
659        try {
660            sLmkdSocket = new LocalSocket(LocalSocket.SOCKET_SEQPACKET);
661            sLmkdSocket.connect(
662                new LocalSocketAddress("lmkd",
663                        LocalSocketAddress.Namespace.RESERVED));
664            sLmkdOutputStream = sLmkdSocket.getOutputStream();
665        } catch (IOException ex) {
666            Slog.w(TAG, "lowmemorykiller daemon socket open failed");
667            sLmkdSocket = null;
668            return false;
669        }
670
671        return true;
672    }

当sLmkdSocket创建之后,就用它来发送数据到对端(lmkd)

674    private static void writeLmkd(ByteBuffer buf) {
675       //尝试三次
676        for (int i = 0; i < 3; i++) {
677            if (sLmkdSocket == null) {
678                    if (openLmkdSocket() == false) {
679                        try {
680                            Thread.sleep(1000);
681                        } catch (InterruptedException ie) {
682                        }
683                        continue;
684                    }
685            }
686
687            try {
688                sLmkdOutputStream.write(buf.array(), 0, buf.position());
689                return;
690            } catch (IOException ex) {
691                Slog.w(TAG, "Error writing to lowmemorykiller socket");
692
693                try {
694                    sLmkdSocket.close();
695                } catch (IOException ex2) {
696                }
697
698                sLmkdSocket = null;
699            }
700        }
701    }
702}
四、总结

这篇文章主要是总结lmk的初步的工作原理,如何为系统的资源保驾护航。核心原理就是Framework层通过调整adj的值和阈值数组,输送给kernel中的lmk,为lmk提供杀进程的原材料。通过前面的分析AMS中给lmkd发送数据原材料有三个入口,携带的命令协议也有三种,如下。

功能AMS对应方法命令内核对应函数
LMK_PROCPRIOPL.setOomAdj()设置指定进程的优先级,也就是oom_score_adjcmd_procprio
LMK_TARGETPL.updateOomLevels()更新/sys/module/lowmemorykiller/parameters/中的minfree以及adjcmd_target 
LMK_PROCREMOVEPL.remove()移除进程cmd_procremove

关于kenel中的工作流程,下面一篇分解。

转载于:https://my.oschina.net/u/920274/blog/3064128

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值