Android 操作系统的内存回收机制

最新推荐文章于 2024-04-28 18:13:49 发布

HabbyGe

最新推荐文章于 2024-04-28 18:13:49 发布

阅读量1.4k

点赞数

分类专栏： Android

Android 专栏收录该内容

263 篇文章 1 订阅

订阅专栏

简介：Android 是一款基于 Linux 内核，面向移动终端的操作系统。为适应其作为移动平台操作系统的特殊需要，谷歌对其做了特别的设计与优化，使应用程序关闭但不退出，并由操作系统进行进程的回收管理。本文在 Application Framework 与 Linux 内核两个层次上，以进程为粒度，对 Android 操作系统的进程资源回收机制进行了剖析。读者可以从本文获得对 Android 应用程序的生存周期的进一步理解，从而更加合理、高效地构建应用程序。

Android APP 的运行环境

Android 是一款基于 Linux 内核，面向移动终端的操作系统。为适应其作为移动平台操作系统的特殊需要，谷歌对其做了特别的设计与优化，使得其进程调度与资源管理与其他平台的 Linux 有明显的区别。主要包含下面几个层次：

1.Application Framework

Application Framework 将整个操作系统分隔成两个部分。对应用开发者而言，所有 APP 都是运行在 Application Framework 之上，而并不需要关心系统底层的情况。Application Framework 层为应用开发者提供了丰富的应用编程接口，如 Activity Manager，Content Provider，Notification Manager，以及各种窗口 Widget 资源等。在 Application Framework 层，Activity 是一个 APP 最基本的组成部分。一般每个 Activity 对应于屏幕上的一个视图（或者说一屏），一个 APP 可以有一个或者多个 Activity。应用程序被打包成 .apk 格式的文件，由 Dalvik VM 解释执行。

2.Dalvik VM

Dalvik 虚拟机采用寄存器架构，而不是 JVM 的栈结构。Java 程序编译后的 .class 文件并不能在 Dalvik 中解释执行。因此 Google 提供了一个 dx 工具，用于将 .class 文件转换成 Dalivk 能够识别的 .dex 格式。具体 Dalvik VM 的细节不是本文重点，以下不再讨论。

3.Linux kernel

由上所述，所有的 APP 都是由 Java 代码编写并在 Dalvik VM 中得到解释执行。在 Android 操作系统中，每个 Dalvik VM 的每个 Instance 都对应于 Linux 内核中的一个进程。可以使用 adb shell 工具查看系统中的当前进程。

Android 内存回收原则

下面将从 Application Framework 和 Linux kernel 两个层次分析 Android 操作系统的资源管理机制。

Android 之所以采用特殊的资源管理机制，原因在于其设计之初就是面向移动终端，所有可用的内存仅限于系统 RAM，必须针对这种限制设计相应的优化方案。当 Android 应用程序退出时，并不清理其所占用的内存，Linux 内核进程也相应的继续存在，所谓“退出但不关闭”。从而使得用户调用程序时能够在第一时间得到响应。当系统内存不足时，系统将激活内存回收过程。为了不因内存回收影响用户体验（如杀死当前的活动进程），Android 基于进程中运行的组件及其状态规定了默认的五个回收优先级：

IMPORTANCE_FOREGROUND:

IMPORTANCE_VISIBLE:

IMPORTANCE_SERVICE:

IMPORTANCE_BACKGROUND:

IMPORTANCE_EMPTY:

这几种优先级的回收顺序是 Empty process、Background process、Service process、Visible process、Foreground process。关于划分原则参见 http://developer.android.com/guide/topics/fundamentals/processes-and-threads.html文件中。

ActivityManagerService 集中管理所有进程的内存资源分配。所有进程需要申请或释放内存之前必须调用 ActivityManagerService 对象，获得其“许可”之后才能进行下一步操作，或者 ActivityManagerService 将直接“代劳”。类 ActivityManagerService 中涉及到内存回收的几个重要的成员方法如下：trimApplications()，updateOomAdjLocked()，activityIdleInternal() 。这几个成员方法主要负责 Android 默认的内存回收机制，若 Linux 内核中的内存回收机制没有被禁用，则跳过默认回收。

默认回收过程

Android 操作系统中的内存回收可分为两个层次，即默认内存回收与内核级内存回收，本章重点对默认内存回收机制进行研究，Linux 内核层次的内存回收机制将在下一张介绍。本章所有代码可参见 ActivityManagerService.java。

回收动作入口：activityIdleInternal()

Android 系统中内存回收的触发点大致可分为三种情况。第一，用户程序调用 StartActivity(), 使当前活动的 Activity 被覆盖；第二，用户按 back 键，退出当前应用程序；第三，启动一个新的应用程序。这些能够触发内存回收的事件最终调用的函数接口就是 activityIdleInternal()。当 ActivityManagerService 接收到异步消息 IDLE_TIMEOUT_MSG 或者 IDLE_NOW_MSG 时，activityIdleInternal() 将会被调用。代码如下：

清单 1. IDLE_NOW_MSG 的处理方式

case IDLE_NOW_MSG:{
    IBinder token = (Ibinder) msg.obj;
    activityIdle(token,null);
}
break;

清单 2. IDLE_TIMEOUT_MSG 的处理方式

case IDLE_TIMEOUT_MSG: {
    if (mDidDexOpt) {
        mDidDexOpt = false;
        Message nmsg = mHandler.obtainMessage(IDLE_TIMEOUT_MSG);
        nmsg.obj = msg.obj;
        mHandler.sendMessageDelayed(nmsg, IDLE_TIMEOUT);
        return;
    }
    IBinder token = (IBinder) msg.obj;
    Slog.w(TAG, "Activity idle timeout for " + token);
    activityIdleInternal(token,true,null);
}
break;

IDLE_NOW_MSG 由 Activity 的切换以及 Activiy 焦点的改变等事件引发，IDLE_TIMEOUT_MSG 在 Activity 启动超时的情况下引发，一般这个超时时间设为 10s，如果 10s 之内一个 Activity 依然没有成功启动，那么将发送异步消息 IDLE_TIMEOUT_MSG 进行资源回收。activityIdleInternal() 的主要任务是改变系统中 Activity 的状态信息，并将其添加到不同状态列表中。其主要工作如下：

首先，调用 scheduleAppGcsLocked() 方法通知所有进行中的任务进行垃圾回收。scheduleAppGcsLocked() 将进行调度 JVM 的 garbage collect，回收一部分内存空间，这里仅仅是通知每个进程自行进程垃圾检查并调度回收时间，而非同步回收。然后，取出 mStoppingActivities 和 mFinishigActivities 列表中的所有内容，暂存在临时变量中。这两个列表分别存储了当前状态为 stop 和 finishi 的 activity 对象。对于 stop 列表，如果其中的 activity 的 finish 状态为 true，判断是不是要立即停止，如果要立即停止则调用 destroyActivityLocked() 通知目标进程调用 onDestroy() 方法，否则，先调用 resumeTopActivity() 运行下一个 Activity。如果 finish 状态为 false，则调用 stopActivityLocked() 通知客户进程停止该 Activity，这种情况一般发生在调用 startActivity() 后。对于 finish 列表，直接调用 destroyActivityLocked() 通知客户进程销毁目标 Activity。

这里的 destroyActivityLocked 等函数并没有真正意义上改变内存的使用，只是将其状态改变为“允许回收”，真正的回收在下面即将调用的 trimApplications() 函数中。

回收过程函数 trimApplications()

trimApplications() 函数的结构如下 :

清单 3. trimApplications 函数

private final void trimApplications() {
    synchronized(this) {
        // First remove any unused application processes whose package has been removed.
        for (i = mRemovedProcesses.size() - 1; i >= 0; i--) {
            (1)//kill process;
        }
        if (!updateOomAdjLocked()) {
            (2)//do something default
        }
        // Finally, if there are too many activities now running, try to
        // finish as many as we can to get back down to the limit.
        (3)dosomething
    }
}

清单 3 中的三个标序号的位置分别负责如下工作：

（1）当程序执行到 trimApplications() 之后，首先检查 mRemovedProcesses 列表中的进程。mRemovedProcesses 列表中主要包含了 crash 的进程、5 秒内没有响应并被用户选在强制关闭的进程、以及应用开发这调用 killBackgroundProcess 想要杀死的进程。调用 Process.killProcess 将所有此类进程全部杀死。

（2）调用 updateOomAdjLocked() 函数，若成功返回，说明 Linux 内核支持 setOomAdj() 接口，updateOomAdjLocked 将修改 adj 的值并通知 linux 内核，内核根据 adj 值以及内存使用情况动态管理进程资源（lowmemorykiller 和 oom_killer）。若 updateOomAdjLocked() 返回为假，则表示当前系统不支持 setOomAdj() 接口，将在本地进行默认的资源回收。

（3）最后，如果当前依然运行了过多的 Activity，对多余的 Activity 进行回收。 trimApplications() 的大多数的代码都在处理 Oom_killer 不存在情况下的默认资源回收，下面对其默认回收过程（即代码清单中标记（2）的位置）进行进一步分析。其回收过程可大致描述如下。

步骤一，获取当前所有运行的进程 mLruProcesses，mLruProcesses 中的排序规则是按最近使用时间。对 mLruProcesses 中不能被关闭的进程进行计数，这些不能被关闭的进程包括运行 service 的进程，运行 broadcast receiver 的进程等，见如下代码。

清单 4. 计数不能被关闭的进程

if (app.persistent || app.services.size() != 0 || app.curReceiver != null || app.persistentActivities > 0) {
    // Don't count processes holding services against our
    // maximum process count.
    numServiceProcs++;
}

步骤二，设当前最大运行进程数 curMaxProcs = curMaxProcs + numServiceProcs（即默认最大进程数与运行 Service 的进程数之和），如果当前进程的数量 mRemovedProcesses.size() 大于这个值，则遍历所有当前运行的进程，杀死符合条件的那些进程并释放内存。清理过程见清单 5（部分代码省略）。从清单 5 的代码中可以看出，进程被杀死的条件是：

● 必须是非 persistent 进程，即非系统进程；

● 必须是空进程，即进程中没有任何 activity 存在。如果杀死存在 Activity 的进程，有可能关闭用户正在使用的程序，或者使应用程序恢复的时延变大，从而影响用户体验；

● 必须无 broadcast receiver。运行 broadcast receiver 一般都在等待一个事件的发生，用户并不希望此类程序被系统强制关闭；

● 进程中 service 的数量必须为 0。存在 service 的进程很有可能在为一个或者多个程序提供某种服务，如 GPS 定位服务。杀死此类进程将使其他进程无法正常服务。

以上条件缺一不可。

清单 5. 清理过程

if (!app.persistent && app.activities.size() == 0 && app.curReceiver == null && app.services.size() == 0) {
    if (app.pid > 0 && app.pid != MY_PID) {
        Process.killProcess(app.pid);
    } else {
        try {
            app.thread.scheduleExit();
        } catch(Exception e) {
            // Ignore exceptions.
        }
    }
    // todo: For now we assume the application is not buggy
    // or evil, and will quit as a result of our request.
    // Eventually we need to drive this off of the death
    // notification, and kill the process if it takes too long.
    cleanUpApplicationRecordLocked(app, false, i);
    i--;
}

步骤三，再次检查当前运行的进程，如果 mRemovedProcesses.size() 仍然大于 curMaxProcs，则放宽条件再次进行回收。判断条件见代码清单 6（部分代码省略）。下面代码中，布尔变量 canQuit 的值为真时，那么这个进程可以被回收。canQuit 的取值分两个步骤，首先是根据进程的属性赋值。 1. 必须是非 persistent 进程，即非系统进程；2. 必须无 broadcast receiver；3. 进程中 service 的数量必须为 0；4. persistent 类型的 activity 数量为 0。与步骤二唯一的不同在第 4 条，这里不要求进程是空进程，只要进程中没有 persistent 类型的 Activity 就可以（Activity 是否是 persistent 类型在开发阶段指定）。这些条件都满足时，再检查进程中每个 Activity 的属性，当该进程中所有的 Activity 都还必须满足三个条件：Activity 的状态已经保存，当前处在不可见状态并且 Activity 已经 Stop。这时杀掉进程只会降低下次调用程序时的加载速度，下次启动时将恢复到关闭之前的状态，并不会在用户体验上造成致命的影响，所以，canQuit 置位为真。这种情况与步骤二的回收方式也有所不同，由于进程中 Activity 的数量不是 0，下一步需要对每个 activity 执行 destroyActivityLocked() 销毁，最后才杀死进程。

清单 6. 执行 destroyActivityLocked() 销毁

booleancanQuit = !app.persistent && app.curReceiver == null && app.services.size() == 0 && app.persistentActivities == 0;
int NUMA = app.activities.size();
for (j = 0; j < NUMA && canQuit; j++) {
    HistoryRecord r = (HistoryRecord) app.activities.get(j);
    canQuit = (r.haveState || !r.stateNotNeeded) && !r.visible && r.stopped;
}
if (canQuit) {
    // Finish all of the activities, and then the app itself.
    for (j = 0; j < NUMA; j++) {
        HistoryRecord r = (HistoryRecord) app.activities.get(j);
        if (!r.finishing) {
            destroyActivityLocked(r,false);
        }
        r.resultTo = null;
    }
    if (app.pid > 0 && app.pid != MY_PID) {
        Process.killProcess(app.pid);
    }
    cleanUpApplicationRecordLocked(app,false, i);
    i--;
    //dump();
}

步骤四，上面 3 个过程都是针对整个 process 进行的资源回收。在以上过程执行完毕之后，将在更小的粒度上对 Activity 的资源进行回收。与上面所述类似，列表 mLRUActivities 存储了当前所有运行中的 Activity，排序规则同样为最少访问原则。mLRUActivities.size() 返回系统中运行的 Activity 的数量，当其大于 MAX_ACTIVITIES（MAX_ACTIVITIES 是一个常量，一般值为 20，代表系统中最大允许同时存在的 Activity）时。将回收部分满足条件的 Activity 以减少内存的使用。回收条件代码清单 7 所示：

清单 7. 回收条件代码

// Finally, if there are too many activities now running, try to
// finish as many as we can to get back down to the limit.
for (i = 0; i < mLRUActivities.size() && mLRUActivities.size()  > curMaxActivities; i++) {
    final HistoryRecord r = (HistoryRecord)mLRUActivities.get(i); 

    // We can finish this one if we have its icicle saved and
    // it is not persistent.
    if ((r.haveState || !r.stateNotNeeded) && !r.visible && r.stopped && !r.persistent && !r.finishing) {
        finalint origSize = mLRUActivities.size();
        destroyActivityLocked(r,true);
        if (origSize > mLRUActivities.size()) {
            i--;
        }
    }
}

这里回收的只是 Activity 的内存资源，并不会杀死进程，也不会影响进程的运行。当进程需要调用被杀掉的 Activity 时，可以从保存的状态中回复，当然可能需要相对长一点的时延。

Linux 内核中的内存回收

lowmemorykiller

上面提到，trimApplications() 函数中会执行一个叫做 updateOomAdjLocked() 的函数，如果返回 false，则执行默认回收，若返回 true 则不执行默认内存回收。updateOomAdjLocked 将针对每一个进程更新一个名为 adj 的变量，并将其告知 Linux 内核，内核维护一个包含 adj 的数据结构（即进程表），并通过 lowmemorykiller 检查系统内存的使用情况，在内存不足的情况下杀死一些进程并释放内存。下面将对这种 Android Framework 与 Linux 内核相配合的内存回收机制进行研究。

由于 Android 操作系统中的所有应用程序都运行在独立的 Dalvik 虚拟机环境中，Linux 内核无法获知每个进程的运行状态，也就无法为每个进程维护一个合适的 adj 值，因此，Android Application Framework 中必须提供一套机制以动态的更新每个进程的 adj。这就是 updateOomAdjLocked()。

updateOomAdjLocked() 位于 ActivityManagerService 中，其主要作用是为进程选择一个合适的 adj 值，并通知 Linux 内核更新这个值。updateOomAdjLocked 首先调用 computeOomAdjLocked() 初步计算 adj 的值，然后回到 updateOomAdjLocked() 对其值进行进一步修正。估算流程可参见代码。

关于 adj，其定义在 task_struct->signal_struct->adj, 文件 /kernel/include/linux/sched.h 中。实质为进程数据结构中的一个变量，用来表示发生 Out of Memory 时杀死进程的优先级顺序。lowmemorykiller 利用这个变量对进程的重要程度进行判断，并在内存不足时释放部分空间，其实现在文件 /kernel/drivers/staging/android/lowmemorykiller.c 中。lowmemorykiller 定义了两个数组：lowmem_adj 和 lowmem_minfree。其中 lowmen_adj 定义了一系列 adj 键值，而 lowmem_minfree 的每个元素代表一个内存阈值。如下代码中四个阈值分别是 6MB，8MB，16MB 和 64MB，分别代表当内存小于 64MB 时，adj 大于或等于 12 的那些进程将被杀死并回收，内存小于 16MB 时，adj 大于等于 6 的那些进程将被杀死并回收，内存小于 8MB 时，adj 大于等于 1 的那些进程将被杀死并回收，内存小于 6MB 时，adj 大于等于 0 的所有进程将被杀死并回收。内核中的每个进程都持有一个 adj，取值范围 -17 到 15，值越小代表进程的重要性越高，回收优先级越低，其中 -17 代表禁用自动回收。Android 系统中，只有 0-15 被使用。

清单 8. 每个进程都持有一个 adj

static int lowmem_adj[6] = {0, 1, 6, 12,};
static int lowmem_adj_size = 4;
static size_t lowmem_minfree[6] = {
    3 * 512,       /* 6MB */
    2 * 1024,     /* 8MB */
    4 * 1024,     /* 16MB */
    16 * 1024,    /* 64MB */
};
staticint lowmem_minfree_size = 4;

lowmemorykiller 注册一个 lowmem_shrinker，lowmem_shrinker 利用了标准 Linux 内核中的 Cache Shrinker 来实现，当空闲内存页面不足时，内核线程 kswapd 将用已注册的 lowmem_shrinker 来回收内存页面。

清单 9. 用已注册的 lowmem_shrinker 来回收内存页面

static struct shrinker lowmem_shrinker = {
    .shrink = lowmem_shrink,
    .seeks = DEFAULT_SEEKS * 16
};
 
static int __init lowmem_init(void) {
    task_free_register(&task_nb);
    register_shrinker(&lowmem_shrinker);
    return 0;
}

lowmem_shrink 的代码在函数 lowmem_shrink 中，下面给出该函数的主要结构。lowmem_shrink 根据上述规则遍历所有进程，选出需要结束的进程，通过发送一个无法忽略的信号 SIGKILL 强制结束这些进程

清单 10. 强制结束进程

static int lowmem_shrink(struct shrinker *s, intnr_to_scan, gfp_t gfp_mask) {
    for_each_process(p) {
       // Select processes to be forced
    }
    if (selected) {
        force_sig(SIGKILL, selected);
        rem -= selected_tasksize;
    } else {
        rem = -1;
    }
    return rem;
}

Oom_killer.

如果上述各种方法都无法释放出足够的内存空间，那么当为新的进程分配应用程序时将发生 Out of Memory 异常，OOM_killer 将尽最后的努力杀掉一些进程来释放空间。Android 中的 OOM_killer 继承自标准 Linux 2.6 内核，用于分配内存时 Out of Memory 的处理。Android 并没有对其实现方式进行修改。其位置在 linux/mm/oom_kill.c。 oom_killer 遍历进程，并计算所有进程的 badness 值，选择 badness 最大的那个进程将其杀掉。函数 badness 的声明如下：

unsigned long badness(struct task_struct *p, unsigned long uptime) 函数 select_bad_process 返回将要杀掉的那个进程。

清单 11. 返回将要杀掉的进程

static struct task_struct *select_bad_process(unsigned long *struct mem_cgroup *mem) {
    for_each_process(p) {
        points = badness(p, uptime.tv_sec);
            if (points > *ppoints || !chosen) {
                chosen = p;
                *ppoints = points;
            }
       }
    }
    return chosen;
}

 
  最后，和 lowmemorykiller 一样，通过发送 SIGKILL 结束选中的进程。由于 oom_killer 与标准 Linux 内核并无不同，这里不再详细研究。 
 

总结

本文研究了 Android 操作系统上的内存回收机制。主要包括 Application Framework 层的默认回收以及 Linux 内核中的 lowmemorykiller、OOM_killer。一般来说应用开发者并不需要控制或者修改系统的内存管理以及回收，但是深入理解这些系统级的管理机制还是必要的，尤其有助于更加合理地设计应用程序，使应用程序的进程在其生命周期内高效地运行。而系统级开发者如果想要对内存管理机制进行优化，对原有机制的理解则是必不可少的重要前提。

转自：http://blog.jobbole.com/25169/

《第二篇》

davlik虚拟机内存管理之一——内存分配

dalvik虚拟机是Google在Android平台上的Java虚拟机的实现，内存管理是dalvik虚拟机中的一个重要组件。

从概念上来说，内存管理的核心就是两个部分：分配内存和回收内存。Java语言使用new操作符来分配内存，但是与C/C++等语言不同的是，Java语言并没有提供任何操作来释放内存，而是通过一种叫做垃圾收集的机制来回收内存。对于内存管理的实现，我们通过三个方面来加以分析：内存分配，内存回收和内存管理调试。本文就是这一系列文章的第一篇，分析dalvik虚拟机是如何分配内存的。

1. 对象布局

内存管理的主要操作之一是为Java对象分配内存，Java对象在虚拟机中的内存布局如下：

所有的对象都有一个相同的头部clazz和lock。
（1）clazz:clazz指向该对象的类对象，类对象用来描述该对象所属的类，这样可以很容易的从一个对象获取该对象所属的类的具体信息。
（2）lock:是一个无符号整数，用以实现对象的同步。
（3）data:存放对象数据，根据对象的不同数据区的大小是不同的。

2. 堆

堆是dalvik虚拟机从操作系统分配的一块连续的虚拟内存。heapBase是堆的起始地址，heapLimit是堆的最大地址，堆大小的最大值可以通过-Xmx选项或dalvik.vm.heapsize指定。在原生系统中，一般dalvik.vm.heapsize值是32M，在MIUI中我们将其设为64M。

3. 堆内存位图

在虚拟机中维护了两个对应于堆内存的位图，称为liveBits和markBits。

在对象布局中，我们看到对象最小占用8个字节。在为对象分配内存时要求必须8字节对齐。这也就是说，对象的大小会调整为8字节的倍数。比如说一个对象的实际大小是13字节，但是在分配内存的时候分配16字节。因此所有对象的起始地址一定是8字节的倍数。堆内存位图就是用来描述堆内存的，每一个bit描述8个字节，因此堆内存位图的大小是对的64分之一。对于MIUI的实现来说，这两个位图各占1M。

liveBits的作用是用来跟踪堆中以分配的内存，每分配一个对象时，对象的内存起始地址对应于位图中的位被设为1。在下一篇垃圾收集中我们会进一步的分析liveBits和markBits这两个位图的作用。

4. 堆的内存管理

在dalvik虚拟机实现中，是通过底层的bionicC库的malloc/free操作来分配/释放内存的。bionicC库的malloc/free操作是基于DougLea的实现(dlmalloc)，这是一个被广泛使用，久经考验的C内存管理库，本文不展开dlmalloc的具体实现，有兴趣的读者请参考http://g.oswego.edu/dl/html/malloc.html。

5. dvmAllocObject

在dalvik虚拟机中，new操作符最终对应dvmAllocObject这个C函数。下面通过伪码的形式列出dvmAllocObject的实现。
Object*dvmAllocObject(ClassObject *clazz, int flags) {
      n = get object size form class object clazz
      first try: allocate n bytes from heap
      if first try failed {
            run garbage collector without collecting soft references
            second try: allocate n bytes from heap
      }
      if second try failed {
            third try: grow the heap and allocate n bytes from heap
            (注释：堆是虚拟内存，一开始并未分配所有的物理内存，只要还没有达到虚拟内存的最大值，可以通过获取更多物理内存的方式来扩展堆)
      }
      if third try failed {
            run garbage collector with collecting soft references
            fourth try: grow the hap and allocate n bytes from heap
      }
      if fourth try failed, return null pointer, dalvik vm will abort
}

可以看出，为了分配内存，虚拟机尽了最大的努力，做了四次尝试。其中进行了两次垃圾收集，第一次不收集SoftReference，第二次收集SoftReference。从中我们也可以看出垃圾收集的时机，实质上在dalvik虚拟机实现中有3个时机可以触发垃圾收集的运行：
（1）程序员显式的调用System.gc()
（2）内存分配失败时
（3）如果分配的对象大小超过384KB，运行并发标记(concurrent mark)，在下一篇文章中会介绍什么是并发标记

6.小结
在dalvik虚拟机中，内存分配操作的流程相对比较简单直观，从一个堆中分配可用内存，分配失败时触发垃圾收集，接下来的文章中我们仔细分析dalvik虚拟机的垃圾收集。
dalvik虚拟机是Google在Android平台上的Java虚拟机的实现，内存管理是dalvik虚拟机中的一个重要组件。

从概念上来说，内存管理的核心就是两个部分：分配内存和回收内存。Java语言使用new操作符来分配内存，但是与C/C++等语言不同的是，Java语言并没有提供任何操作来释放内存，而是通过一种叫做垃圾收集的机制来回收内存。对于内存管理的实现，我们通过三个方面来加以分析：内存分配，内存回收和内存管理调试。本文就是这一系列文章的第一篇，分析dalvik虚拟机是如何分配内存的。

1. 对象布局

内存管理的主要操作之一是为Java对象分配内存，Java对象在虚拟机中的内存布局如下：

所有的对象都有一个相同的头部clazz和lock。
（1）clazz:clazz指向该对象的类对象，类对象用来描述该对象所属的类，这样可以很容易的从一个对象获取该对象所属的类的具体信息。
（2）lock:是一个无符号整数，用以实现对象的同步。
（3）data:存放对象数据，根据对象的不同数据区的大小是不同的。

2. 堆

堆是dalvik虚拟机从操作系统分配的一块连续的虚拟内存。heapBase是堆的起始地址，heapLimit是堆的最大地址，堆大小的最大值可以通过-Xmx选项或dalvik.vm.heapsize指定。在原生系统中，一般dalvik.vm.heapsize值是32M，在MIUI中我们将其设为64M。

3. 堆内存位图

在虚拟机中维护了两个对应于堆内存的位图，称为liveBits和markBits。

在对象布局中，我们看到对象最小占用8个字节。在为对象分配内存时要求必须8字节对齐。这也就是说，对象的大小会调整为8字节的倍数。比如说一个对象的实际大小是13字节，但是在分配内存的时候分配16字节。因此所有对象的起始地址一定是8字节的倍数。堆内存位图就是用来描述堆内存的，每一个bit描述8个字节，因此堆内存位图的大小是对的64分之一。对于MIUI的实现来说，这两个位图各占1M。

liveBits的作用是用来跟踪堆中以分配的内存，每分配一个对象时，对象的内存起始地址对应于位图中的位被设为1。在下一篇垃圾收集中我们会进一步的分析liveBits和markBits这两个位图的作用。

4. 堆的内存管理

在dalvik虚拟机实现中，是通过底层的bionicC库的malloc/free操作来分配/释放内存的。bionicC库的malloc/free操作是基于DougLea的实现(dlmalloc)，这是一个被广泛使用，久经考验的C内存管理库，本文不展开dlmalloc的具体实现，有兴趣的读者请参考http://g.oswego.edu/dl/html/malloc.html。

5. dvmAllocObject

在dalvik虚拟机中，new操作符最终对应dvmAllocObject这个C函数。下面通过伪码的形式列出dvmAllocObject的实现。
Object*dvmAllocObject(ClassObject *clazz, int flags) {
      n = get object size form class object clazz
      first try: allocate n bytes from heap
      if first try failed {
            run garbage collector without collecting soft references
            second try: allocate n bytes from heap
      }
      if second try failed {
            third try: grow the heap and allocate n bytes from heap
            (注释：堆是虚拟内存，一开始并未分配所有的物理内存，只要还没有达到虚拟内存的最大值，可以通过获取更多物理内存的方式来扩展堆)
      }
      if third try failed {
            run garbage collector with collecting soft references
            fourth try: grow the hap and allocate n bytes from heap
      }
      if fourth try failed, return null pointer, dalvik vm will abort
}

可以看出，为了分配内存，虚拟机尽了最大的努力，做了四次尝试。其中进行了两次垃圾收集，第一次不收集SoftReference，第二次收集SoftReference。从中我们也可以看出垃圾收集的时机，实质上在dalvik虚拟机实现中有3个时机可以触发垃圾收集的运行：
（1）程序员显式的调用System.gc()
（2）内存分配失败时
（3）如果分配的对象大小超过384KB，运行并发标记(concurrent mark)，在下一篇文章中会介绍什么是并发标记

6.小结
在dalvik虚拟机中，内存分配操作的流程相对比较简单直观，从一个堆中分配可用内存，分配失败时触发垃圾收集，接下来的文章中我们仔细分析dalvik虚拟机的垃圾收集。
dalvik虚拟机是Google在Android平台上的Java虚拟机的实现，内存管理是dalvik虚拟机中的一个重要组件。

从概念上来说，内存管理的核心就是两个部分：分配内存和回收内存。Java语言使用new操作符来分配内存，但是与C/C++等语言不同的是，Java语言并没有提供任何操作来释放内存，而是通过一种叫做垃圾收集的机制来回收内存。对于内存管理的实现，我们通过三个方面来加以分析：内存分配，内存回收和内存管理调试。本文就是这一系列文章的第一篇，分析dalvik虚拟机是如何分配内存的。

1. 对象布局

内存管理的主要操作之一是为Java对象分配内存，Java对象在虚拟机中的内存布局如下：

所有的对象都有一个相同的头部clazz和lock。
（1）clazz:clazz指向该对象的类对象，类对象用来描述该对象所属的类，这样可以很容易的从一个对象获取该对象所属的类的具体信息。
（2）lock:是一个无符号整数，用以实现对象的同步。
（3）data:存放对象数据，根据对象的不同数据区的大小是不同的。

2. 堆

堆是dalvik虚拟机从操作系统分配的一块连续的虚拟内存。heapBase是堆的起始地址，heapLimit是堆的最大地址，堆大小的最大值可以通过-Xmx选项或dalvik.vm.heapsize指定。在原生系统中，一般dalvik.vm.heapsize值是32M，在MIUI中我们将其设为64M。

3. 堆内存位图

在虚拟机中维护了两个对应于堆内存的位图，称为liveBits和markBits。

在对象布局中，我们看到对象最小占用8个字节。在为对象分配内存时要求必须8字节对齐。这也就是说，对象的大小会调整为8字节的倍数。比如说一个对象的实际大小是13字节，但是在分配内存的时候分配16字节。因此所有对象的起始地址一定是8字节的倍数。堆内存位图就是用来描述堆内存的，每一个bit描述8个字节，因此堆内存位图的大小是对的64分之一。对于MIUI的实现来说，这两个位图各占1M。

liveBits的作用是用来跟踪堆中以分配的内存，每分配一个对象时，对象的内存起始地址对应于位图中的位被设为1。在下一篇垃圾收集中我们会进一步的分析liveBits和markBits这两个位图的作用。

4. 堆的内存管理

在dalvik虚拟机实现中，是通过底层的bionicC库的malloc/free操作来分配/释放内存的。bionicC库的malloc/free操作是基于DougLea的实现(dlmalloc)，这是一个被广泛使用，久经考验的C内存管理库，本文不展开dlmalloc的具体实现，有兴趣的读者请参考http://g.oswego.edu/dl/html/malloc.html。

5. dvmAllocObject

在dalvik虚拟机中，new操作符最终对应dvmAllocObject这个C函数。下面通过伪码的形式列出dvmAllocObject的实现。
Object*dvmAllocObject(ClassObject *clazz, int flags) {
      n = get object size form class object clazz
      first try: allocate n bytes from heap
      if first try failed {
            run garbage collector without collecting soft references
            second try: allocate n bytes from heap
      }
      if second try failed {
            third try: grow the heap and allocate n bytes from heap
            (注释：堆是虚拟内存，一开始并未分配所有的物理内存，只要还没有达到虚拟内存的最大值，可以通过获取更多物理内存的方式来扩展堆)
      }
      if third try failed {
            run garbage collector with collecting soft references
            fourth try: grow the hap and allocate n bytes from heap
      }
      if fourth try failed, return null pointer, dalvik vm will abort
}

可以看出，为了分配内存，虚拟机尽了最大的努力，做了四次尝试。其中进行了两次垃圾收集，第一次不收集SoftReference，第二次收集SoftReference。从中我们也可以看出垃圾收集的时机，实质上在dalvik虚拟机实现中有3个时机可以触发垃圾收集的运行：
（1）程序员显式的调用System.gc()
（2）内存分配失败时
（3）如果分配的对象大小超过384KB，运行并发标记(concurrent mark)，在下一篇文章中会介绍什么是并发标记

6.小结
在dalvik虚拟机中，内存分配操作的流程相对比较简单直观，从一个堆中分配可用内存，分配失败时触发垃圾收集，接下来的文章中我们仔细分析dalvik虚拟机的垃圾收集。

dalvik虚拟内存管理之二——垃圾收集

垃圾收集是 dalvik 虚拟机内存管理的核心，垃圾收集的性能在很大程度上影响了一个 Java 程序内存使用的效率。顾名思义，垃圾收集就是收集垃圾内存加以回收。 dalvik 虚拟机使用常用的 Mark-Sweep 算法，该算法一般分 Mark 阶段（标记出活动对象）， Sweep 阶段（回收垃圾内存）和可选的 Compact 阶段（减少堆中的碎片）。 dalvik 虚拟机的实现不进行可选的 Compact 阶段。
1. Mark
垃圾收集的第一步是标记出活动对象，因为没有办法识别那些不可访问的对象 (unreachableobjects) ，因此我们只能标记出活动对象，这样所有未被标记的对象就是可以回收的垃圾。

1.1 根集合 (RootSet)

当进行垃圾收集时，需要停止 dalvik 虚拟机的运行（当然，除了垃圾收集之外）。因此垃圾收集又被称作 STW （ stop-the-world ，整个世界因我而停止）。 dalvik 虚拟机在运行过程中要维护一些状态信息，这些信息包括：每个线程所保存的寄存器， Java 类中的静态字段，局部和全局的 JNI 引用， JVM 中的所有函数调用会对应一个相应 C 的栈帧。每一个栈帧里可能包含对对象的引用，比如包含对象引用的局部变量和参数。

所有这些引用信息被加入到一个集合中，叫根集合。然后从根集合开始，递归的查找可以从根集合出发访问的对象。因此， Mark 过程又被成为追踪，追踪所有可被访问的对象。如下图所示，假定从根集合 {a} 开始，我们可以访问的对象集合为 {a,b, c, d} ，这样就追踪出所有可被访问的对象集合。

1.2 标记栈 (MarkStack)

垃圾收集使用栈来保存根集合，然后对栈中的每一个元素，递归追踪所有可访问的对象，对于所有可访问的对象，在 markBits 位图中该将对象的内存起始地址对应的位设为 1 。这样当栈为空时， markBits 位图就是所有可访问的对象集合。

2. Sweep

垃圾收集的第二步就是回收内存，在 Mark 阶段通过 markBits 位图我们可以得到所有可访问的对象集合，而 liveBits 位图表示所有已经分配的对象集合。因此通过比较这两个位图， liveBits 位图和 markBits 位图的差异就是所有可回收的对象集合。 Sweep 阶段调用 free 来释放这些内存给堆。

3. Concurrent Mark( 并发标记 )

为了运行垃圾收集，需要停止虚拟机的运行，这可能会导致程序比较长时间的停顿。垃圾收集的主要工作位于 Mark 阶段，为了缩短停顿时间， dalvik 虚拟机使用了 concurrentmark 技术。 Concurrentmark 引入一个单独的 gc 线程，由该线程去跟踪自己的根集合中所有可访问的对象，同时所有其它的线程也在运行。这也是 concurrent 一词的含义，但是为了回收内存，即运行 Sweep 阶段，必需停止虚拟机的运行。这会导入一个问题，即在 gc 线程 mark 对象的时候，其它线程的运行又引入了新的访问对象。因此在 Sweep 阶段，又重新运行 mark 阶段，但是在这个阶段对于已经 mark 的对象可以不用继续递归追踪了。这样从一定程度上降低了程序停顿时间。

垃圾收集是dalvik虚拟机内存管理的核心，垃圾收集的性能在很大程度上影响了一个Java程序内存使用的效率。顾名思义，垃圾收集就是收集垃圾内存加以回收。dalvik虚拟机使用常用的Mark-Sweep算法，该算法一般分Mark阶段（标记出活动对象），Sweep阶段（回收垃圾内存）和可选的Compact阶段（减少堆中的碎片）。dalvik虚拟机的实现不进行可选的Compact阶段。
1. Mark
垃圾收集的第一步是标记出活动对象，因为没有办法识别那些不可访问的对象(unreachableobjects)，因此我们只能标记出活动对象，这样所有未被标记的对象就是可以回收的垃圾。

1.1 根集合(RootSet)

当进行垃圾收集时，需要停止dalvik虚拟机的运行（当然，除了垃圾收集之外）。因此垃圾收集又被称作STW（stop-the-world，整个世界因我而停止）。dalvik虚拟机在运行过程中要维护一些状态信息，这些信息包括：每个线程所保存的寄存器，Java类中的静态字段，局部和全局的JNI引用，JVM中的所有函数调用会对应一个相应C的栈帧。每一个栈帧里可能包含对对象的引用，比如包含对象引用的局部变量和参数。

所有这些引用信息被加入到一个集合中，叫根集合。然后从根集合开始，递归的查找可以从根集合出发访问的对象。因此，Mark过程又被成为追踪，追踪所有可被访问的对象。如下图所示，假定从根集合{a}开始，我们可以访问的对象集合为{a,b, c, d}，这样就追踪出所有可被访问的对象集合。

1.2 标记栈(MarkStack)

垃圾收集使用栈来保存根集合，然后对栈中的每一个元素，递归追踪所有可访问的对象，对于所有可访问的对象，在markBits位图中该将对象的内存起始地址对应的位设为1。这样当栈为空时，markBits位图就是所有可访问的对象集合。

2. Sweep

垃圾收集的第二步就是回收内存，在Mark阶段通过markBits位图我们可以得到所有可访问的对象集合，而liveBits位图表示所有已经分配的对象集合。因此通过比较这两个位图，liveBits位图和markBits位图的差异就是所有可回收的对象集合。Sweep阶段调用free来释放这些内存给堆。

3. Concurrent Mark(并发标记)

为了运行垃圾收集，需要停止虚拟机的运行，这可能会导致程序比较长时间的停顿。垃圾收集的主要工作位于Mark阶段，为了缩短停顿时间，dalvik虚拟机使用了concurrentmark技术。Concurrentmark引入一个单独的gc线程，由该线程去跟踪自己的根集合中所有可访问的对象，同时所有其它的线程也在运行。这也是concurrent一词的含义，但是为了回收内存，即运行Sweep阶段，必需停止虚拟机的运行。这会导入一个问题，即在gc线程mark对象的时候，其它线程的运行又引入了新的访问对象。因此在Sweep阶段，又重新运行mark阶段，但是在这个阶段对于已经mark的对象可以不用继续递归追踪了。这样从一定程度上降低了程序停顿时间。

dalvik虚拟内存管理之三——调试信息

1. verbosegc
一般 Java 虚拟机要求支持 verbosegc 选项，输出详细的垃圾收集调试信息。 dalvik 虚拟机很安静的接受 verbosegc 选项，然后什么都不做。 dalvik 虚拟机使用自己的一套 LOG 机制来输出调试信息。

如果在Linux下运行 adb logcat 命令，可以看到如下的输出：
D/dalvikvm( 745): GC_CONCURRENT freed 199K, 53% free 3023K/6343K,external 0K/0K, paused 2ms+2ms

其中 D/dalvikvm 表示由 dalvikvm 输出的调试信息，括号后的数字代表 dalvikvm 所在进程的 pid 。
GC_CONCURRENT 表示触发垃圾收集的原因，有以下几种：

GC_MALLOC, 内存分配失败时触发
GC_CONCURRENT，当分配的对象大小超过384K时触发
GC_EXPLICIT，对垃圾收集的显式调用(System.gc)
GC_EXTERNAL_ALLOC，外部内存分配失败时触发

freed 199K 表示本次垃圾收集释放了 199K 的内存，
53% free 3023K/6343K ，其中 6343K 表示当前内存总量， 3023K 表示可用内存， 53% 表示可用内存占总内存的比例。
external 0K/0K ，表示可用外部内存 / 外部内存总量
paused 2ms+2ms ，第一个时间值表示 markrootset 的时间，第二个时间值表示第二次 mark 的时间。如果触发原因不是 GC_CONCURRENT ，这一行为单个时间值，表示垃圾收集的耗时时间。

2. 分析
（ 1 ）虽然 dalvikvm 提供了一些调试信息，但是还缺乏一些关键信息，比如说 mark 和 sweep 的时间，
分配内存失败时是因为分配多大的内存失败，还有对于 SoftReference,WeakReference 和 PhantomReference 的处理，每次垃圾收集处理了多少个这些引用等。
（ 2 ）目前 dalvik 所有线程共享一个内存堆，这样在分配内存时必须在线程之间互斥，可以考虑为每个内存分配一个线程局部存储堆，一些小的内存分配可以直接从该堆中分配而无须互斥锁。
（ 3 ） dalvik 虚拟机中引入了 concurrentmark ，但是对于多核 CPU ，可以实现 parrelmark ，即可以使用多个线程同时运行 mark 阶段。

这些都是目前 dalvik 虚拟机内存管理可以做出的改进。

转自：http://www.eoeandroid.com/forum.php?mod=collection&action=view&ctid=279