0、引言
Android的底层内核是基于Linux构建而成,是在Native世界,而Android上层的应用是隶属Java世界。那么在Android系统启动过程中,系统是如何从Native孵化出Java世界的呢?这便是这篇文章的主角Zygote的主要职责。
本文所选Android系统版本是9.0 Pie,文中所有代码片段路径在代码块第一行已经标注。文章的目的是记录自己的学习历程与心得,不做商用或盈利,凡是学习过程中学习或引用过的大佬博文或著作都会尽力标注,在此感谢各位前辈的不吝分享。本文借鉴如下:
- 《Android系统启动-zygote篇》—— 袁辉辉
- 《Android系统进程Zygote启动过程的源代码分析》—— 罗升阳
- 《[深入理解Android卷一全文-第四章]深入理解zygote》 —— 邓平凡
- 《Android10.0系统启动之Zygote进程-[Android取经之路]》—— IngresGe
1、C/C++中的Zygote
上篇文章《Android9.0(Pie)1号进程init的启动流程学习》中说到,Android系统的1号进程init会通过.rc配置文件启动其他进程,zygote也是此方式被启动的。不过在pie\system\core\rootdir\目录下有好几个zygote的rc文件,根据生产环境的设备的CPU配置不同,有init.zygote32.rc、init.zygote32_64.rc、init.zygote64.rc、init.zygote64_32.rc这几个选择。在init.rc头部可以看到其导入对应配置的rc文件时,是根据属性ro.zygote来控制的,由于我的生产环境该属性值为zygote32,所以 参考《Android系统init进程启动及init.rc全解析》和《Android源码之init.rc文件详解》 来看看init.zygote32.rc吧。
// pie\system\core\rootdir\init.zygote32.rc
service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-server
class main //该服务指定类属为main,这样方便操作多个服务同时启动或停止
priority -20 //参考linux的进程优先级nice,取值范围【-20,19】,值越小优先级越高
user root //在执行此服务之前先切换用户名为root
group root readproc reserved_disk //类似于user,切换组名
socket zygote stream 660 root system //在目标机/dev/socket/目录下创建一个unix domain类型的socket,该socket文件命名为zygote,端口为660,运行该程序需要root或system权限
onrestart write /sys/android_power/request_state wake //该服务重启时,向指定文件中写入内容
onrestart write /sys/power/state on
onrestart restart audioserver //该服务重启时,重启指定服务
onrestart restart cameraserver
onrestart restart media
onrestart restart netd
onrestart restart wificond
writepid /dev/cpuset/foreground/tasks //创建子进程时向该文件中写入进程的pid
1.1、app_process
从第一行可以看出zygote只是对程序的重命名,实际运行的是目标机/system/bin目录下的app_process程序,其后面跟的是运行该程序所带的参数,即这个app_process是一个命令行程序,那么先找到这个程序的main函数,鉴于该函数较长,我们将主要代码分割成几个部分来看。
1.1.1、AndroidRuntime初始化
// pie\frameworks\base\cmds\app_process\app_main.cpp
int main(int argc, char* const argv[])
{
if (!LOG_NDEBUG) { //debug模式下打印一下传进来的参数,方便调试和定位问题
String8 argv_String;
for (int i = 0; i < argc; ++i) {
argv_String.append("\"");
argv_String.append(argv[i]);
argv_String.append("\" ");
}
ALOGV("app_process main with argv: %s", argv_String.string());
}
AppRuntime runtime(argv[0], computeArgBlockSize(argc, argv)); //调用父类AndroidRuntime的构造函数进行初始化
argc--;
argv++; // 忽略程序名所占用的第一个参数argv[0]
…………
}
这里的AppRuntime是继承的pie\frameworks\base\core\jni\AndroidRuntime.cpp,AppRuntime类的构造函数为空,所以转去调用父类AndroidRuntime的构造函数:
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
AndroidRuntime::AndroidRuntime(char* argBlockStart, const size_t argBlockLength) :
mExitWithoutCleanup(false), //使用命令行传进来的参数初始化该类的成员变量,
mArgBlockStart(argBlockStart), //首个参数起始位置,
mArgBlockLength(argBlockLength) //以及所有参数块所占内存大小
{
init_android_graphics(); //初始化android图形功能
mOptions.setCapacity(20); //虚拟机启动时需要一些option作为参数,这里设置option数量
assert(gCurRuntime == NULL); //每个进程都要进行空指针检测
gCurRuntime = this;
}
1.1.2、spaced_commands TODO
这一部分spaced_commands相关的内容有点不知所云,但又不影响往后分析,所以先放着,后面明白了再来补充,有大佬知道的也可以评论里补充下,不胜感激。
// pie\frameworks\base\cmds\app_process\app_main.cpp
int main(int argc, char* const argv[])
{
…………
const char* spaced_commands[] = { "-cp", "-classpath" };
bool known_command = false;
int i;
for (i = 0; i < argc; i++) {
if (known_command == true) {
runtime.addOption(strdup(argv[i]));
ALOGV("app_process main add known option '%s'", argv[i]);
known_command = false;
continue;
}
for (int j = 0;
j < static_cast<int>(sizeof(spaced_commands) / sizeof(spaced_commands[0]));
++j) {
if (strcmp(argv[i], spaced_commands[j]) == 0) {
known_command = true;
ALOGV("app_process main found known command '%s'", argv[i]);
}
}
if (argv[i][0] != '-') {
break;
}
if (argv[i][1] == '-' && argv[i][2] == 0) {
++i; // Skip --.
break;
}
runtime.addOption(strdup(argv[i]));
ALOGV("app_process main add option '%s'", argv[i]);
}
}
1.1.3、参数解析
// pie\frameworks\base\cmds\app_process\app_main.cpp
int main(int argc, char* const argv[])
{
…………
bool zygote = false;
bool startSystemServer = false;
bool application = false;
String8 niceName;
String8 className;
++i; // 跳过没有用到的参数"/system/bin"
while (i < argc) {
const char* arg = argv[i++];
if (strcmp(arg, "--zygote") == 0) { //解析到参数"--zygote"时,
zygote = true; //说明为zygote模式
niceName = ZYGOTE_NICE_NAME; //准备app_process进程的别名ZYGOTE_NICE_NAME="zygote"
} else if (strcmp(arg, "--start-system-server") == 0) { //解析到参数"--start-system-server"时
startSystemServer = true; //需要启动system_server
} else if (strcmp(arg, "--application") == 0) { //如果参数中有"--application",
application = true; //则为application模式
} else if (strncmp(arg, "--nice-name=", 12) == 0) {
niceName.setTo(arg + 12); //application模式下设置别名
} else if (strncmp(arg, "--", 2) != 0) {
className.setTo(arg); //application模式下设置类名
break;
} else {
--i;
break;
}
}
Vector<String8> args;
if (!className.isEmpty()) { //非zygote模式下,传递参数"application"给RuntimeInit
args.add(application ? String8("application") : String8("tool"));
runtime.setClassNameAndArgs(className, argc - i, argv + i); //传递类名和剩余参数
if (!LOG_NDEBUG) {
String8 restOfArgs;
char* const* argv_new = argv + i;
int argc_new = argc - i;
for (int k = 0; k < argc_new; ++k) {
restOfArgs.append("\"");
restOfArgs.append(argv_new[k]);
restOfArgs.append("\" ");
}
ALOGV("Class name = %s, args = %s", className.string(), restOfArgs.string());
}
} else { //zygote模式下
maybeCreateDalvikCache(); //创建/data/dalvik-cache/目录
if (startSystemServer) {
args.add(String8("start-system-server")); //传递参数"start-system-server"
}
char prop[PROP_VALUE_MAX];
if (property_get(ABI_LIST_PROPERTY, prop, NULL) == 0) { //读取abi接口list
LOG_ALWAYS_FATAL("app_process: Unable to determine ABI list from property %s.",
ABI_LIST_PROPERTY);
return 11;
}
String8 abiFlag("--abi-list=");
abiFlag.append(prop);
args.add(abiFlag); //传递系统支持的CPU架构类型参数"--abi-list=armeabi-v7a,armeabi,……"
for (; i < argc; ++i) {
args.add(String8(argv[i])); //传递剩余的参数
}
}
}
这里主要是针对main函数传递进来的参数,解析zygote模式和application模式下的相关参数,根据参数进行设置类名、进程别名、置位标识、传递参数到AndroidRuntime等动作。
1.1.4、runtime.start()
// pie\frameworks\base\cmds\app_process\app_main.cpp
int main(int argc, char* const argv[])
{
…………
if (!niceName.isEmpty()) {
runtime.setArgv0(niceName.string(), true); //设置进程的别名为前面准备好的niceName
}
if (zygote) { //zygote模式
runtime.start("com.android.internal.os.ZygoteInit", args, zygote); //调用父类AndroidRuntime的start()函数
} else if (className) { //application模式
runtime.start("com.android.internal.os.RuntimeInit", args, zygote);
} else {
fprintf(stderr, "Error: no class name or --zygote supplied.\n");
app_usage();
LOG_ALWAYS_FATAL("app_process: no class name or --zygote supplied.");
}
}
这里主要是为app_process进程设置别名,然后调用runtime.start()调用父类AndroidRuntime的start()函数,该函数的功能我们后面再看。到此为止的函数调用情况如下图所示:
1.2、AndroidRuntime::start()
1.2.1、环境变量相关
这个函数依然分割开来看,第一部分比较简单,就做了一些事件打印,和环境变量相关的设置与检测:
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
ALOGD(">>>>>> START %s uid %d <<<<<<\n",
className != NULL ? className : "(unknown)", getuid());
static const String8 startSystemServer("start-system-server");
bool primary_zygote = false;
for (size_t i = 0; i < options.size(); ++i) {
if (options[i] == startSystemServer) {
primary_zygote = true;
const int LOG_BOOT_PROGRESS_START = 3000;
LOG_EVENT_LONG(LOG_BOOT_PROGRESS_START, ns2ms(systemTime(SYSTEM_TIME_MONOTONIC))); //带时间打印一下startSystemServer事件
}
}
const char* rootDir = getenv("ANDROID_ROOT");
if (rootDir == NULL) {
rootDir = "/system";
if (!hasDir("/system")) {
LOG_FATAL("No root directory specified, and /system does not exist.");
return;
}
setenv("ANDROID_ROOT", rootDir, 1); //设置环境变量
}
const char* artRootDir = getenv("ANDROID_ART_ROOT"); //检查环境变量
if (artRootDir == NULL) {
LOG_FATAL("No ART directory specified with ANDROID_ART_ROOT environment variable.");
return;
}
const char* i18nRootDir = getenv("ANDROID_I18N_ROOT");
if (i18nRootDir == NULL) {
LOG_FATAL("No runtime directory specified with ANDROID_I18N_ROOT environment variable.");
return;
}
const char* tzdataRootDir = getenv("ANDROID_TZDATA_ROOT");
if (tzdataRootDir == NULL) {
LOG_FATAL("No tz data directory specified with ANDROID_TZDATA_ROOT environment variable.");
return;
}
…………
}
1.2.2、加载虚拟机库
// // pie\frameworks\base\core\jni\AndroidRuntime.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
JniInvocation jni_invocation;
jni_invocation.Init(NULL);
…………
}
接下来能看到的就是JniInvocation类,该类相关定义位于pie/libnativehelper/目录下,其主要功能是向外部提供了动态调用虚拟机内部的相关接口。首先来看代码中调用的Init()函数:
// pie\libnativehelper\JniInvocation.cpp
bool JniInvocation::Init(const char* library) {
#ifdef __ANDROID__
char buffer[PROP_VALUE_MAX];
#else
char* buffer = NULL;
#endif
library = GetLibrary(library, buffer); //获取默认库libart.so
//RTLD_NOW:dlopen函数的打开模式为立即解析出所有未定义符号,如果解析不出来,在dlopen会返回NULL
//RTLD_NODELETE:在dlclose()期间不卸载库,因为即使在JNI_DeleteJavaVM返回后,一些线程可能还没有完成退出,如果卸载库,这可能会导致段错误
const int kDlopenFlags = RTLD_NOW | RTLD_NODELETE;
handle_ = dlopen(library, kDlopenFlags); //打开libart.so库,获取到句柄
if (handle_ == NULL) { //如果打开失败,则再尝试一次,确保正常打开libart.so
if (strcmp(library, kLibraryFallback) == 0) {
ALOGE("Failed to dlopen %s: %s", library, dlerror());
return false;
}
ALOGW("Falling back from %s to %s after dlopen error: %s", library, kLibraryFallback, dlerror());
library = kLibraryFallback;
handle_ = dlopen(library, kDlopenFlags);
if (handle_ == NULL) {
ALOGE("Failed to dlopen %s: %s", library, dlerror());
return false;
}
}
//FindSymbol()函数通过调用dlsym()函数,获取JNI_GetDefaultJavaVMInitArgs、JNI_CreateJavaVM、JNI_GetCreatedJavaVMs这三个函数的地址
if (!FindSymbol(reinterpret_cast<void**>(&JNI_GetDefaultJavaVMInitArgs_), "JNI_GetDefaultJavaVMInitArgs")) {
return false;
}
if (!FindSymbol(reinterpret_cast<void**>(&JNI_CreateJavaVM_), "JNI_CreateJavaVM")) {
return false;
}
if (!FindSymbol(reinterpret_cast<void**>(&JNI_GetCreatedJavaVMs_), "JNI_GetCreatedJavaVMs")) {
return false;
}
return true;
}
可以看出Init函数主要功能就是寻找并打开默认虚拟机库,并根据打开文件句柄获取到库中几个关键函数的指针。需要说明下的是,这里GetLibrary()去获取的默认库是虚拟机的库,在较早的版本比如4.4 kitkak中使用的是dalvik虚拟机,所以获取的默认库是libdvm.so,在之后的高版本中就有art虚拟机了,所以默认库就是libart.so。两者的主要区别主要是art虚拟机把字节码的翻译优化从运行时提前到安装时, 以空间换时间,从而优化运行加载时间。
1.2.3、启动JavaVM
// pie\libnativehelper\JniInvocation.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
JNIEnv* env;
if (startVm(&mJavaVM, &env, zygote, primary_zygote) != 0) {
return;
}
onVmCreated(env); //空接口
…………
}
首先出现的JNIEnv是在JNI编程中经常会出现的东西,其相关的定义是在文件pie\libnativehelper\include_jni\jni.h中,所以这里也是为后面注册JNI函数做准备。先来看startVm()函数,其主要功能就是创建JavaVM,该函数中有很多addOption(操作,这里截取一部分进行说明。
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
int AndroidRuntime::startVm(JavaVM** pJavaVM, JNIEnv** pEnv, bool zygote, bool primary_zygote)
{
JavaVMInitArgs initArgs;
…………
addOption(***); //此处省略一大堆通过属性值或配置来向Vector<JavaVMOption> mOptions中添加的动作
…………
//对结构体JavaVMInitArgs的成员赋值
initArgs.version = JNI_VERSION_1_4;
initArgs.options = mOptions.editArray();
initArgs.nOptions = mOptions.size();
initArgs.ignoreUnrecognized = JNI_FALSE;
//调用前面打开的libart.so库中的JNI_CreateJavaVM函数以创建JavaVM。
//JavaVM*本质上是每个进程的,而JNIEnv*是每个线程的。如果这里创建成功,就可以发出JNI调用了。
if (JNI_CreateJavaVM(pJavaVM, pEnv, &initArgs) < 0) {
ALOGE("JNI_CreateJavaVM failed\n");
return -1;
}
return 0;
}
1.2.4、注册JNI函数
// pie\libnativehelper\JniInvocation.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
if (startReg(env) < 0) { //注册JNI函数
ALOGE("Unable to register all android natives\n");
return;
}
…………
}
// pie\libnativehelper\JniInvocation.cpp
int AndroidRuntime::startReg(JNIEnv* env)
{
ATRACE_NAME("RegisterAndroidNatives");
//设置Threads.cpp中创建线程的函数为javaCreateThreadEtc
androidSetCreateThreadFunc((android_create_thread_fn) javaCreateThreadEtc);
ALOGV("--- registering native functions ---\n");
//每个注册函数都会返回一个或多个native引用的对象,此时虚拟机还没有完全启动起来,
//所以这里先用Frame管理局部引用的生命周期,参数200是为了足够的空间来存储。
env->PushLocalFrame(200);
if (register_jni_procs(gRegJNI, NELEM(gRegJNI), env) < 0) { //JNI函数注册动作
env->PopLocalFrame(NULL);
return -1;
}
env->PopLocalFrame(NULL);
return 0;
}
参考《android系统核心机制 基础(02)Thread类解析》,可知这里的androidSetCreateThreadFunc()函数是pie\system\core\libutils\Threads.cpp中的函数,这里的动作是将Threads类中创建线程的函数从androidCreateRawThreadEtc()设置为了AndroidRuntime.cpp中定义的javaCreateThreadEtc()。虽说最终调用的还是androidCreateRawThreadEtc()函数,但线程函数改为了AndroidRuntime.cpp中的javaThreadShell()函数。
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
int AndroidRuntime::javaCreateThreadEtc(
android_thread_func_t entryFunction,
void* userData,
const char* threadName,
int32_t threadPriority,
size_t threadStackSize,
android_thread_id_t* threadId)
{
void** args = (void**) malloc(3 * sizeof(void*)); //javaThreadShell()函数中使用完后要记得free
int result;
LOG_ALWAYS_FATAL_IF(threadName == nullptr, "threadName not provided to javaCreateThreadEtc");
args[0] = (void*) entryFunction;
args[1] = userData;
args[2] = (void*) strdup(threadName); // javaThreadShell()函数中使用完后要记得free
//最终还是调用androidCreateRawThreadEtc(),但将线程函数设置为了javaThreadShell()
result = androidCreateRawThreadEtc(AndroidRuntime::javaThreadShell, args,
threadName, threadPriority, threadStackSize, threadId);
return result;
}
// 线程函数
int AndroidRuntime::javaThreadShell(void* args) {
void* start = ((void**)args)[0];
void* userData = ((void **)args)[1];
char* name = (char*) ((void **)args)[2];
free(args); //释放上面javaCreateThreadEtc函数中malloc的args
JNIEnv* env;
int result;
if (javaAttachThread(name, &env) != JNI_OK) //使当前创建的线程对VM可见
return -1;
result = (*(android_thread_func_t)start)(userData); //运行创建的该线程
javaDetachThread(); //线程退出时将当前线程从虚拟机可见的线程集中分离
free(name);
return result;
}
androidSetCreateThreadFunc()函数分析完后,我们往下看比较重要的register_jni_procs()函数,其主要功能就是注册JNI函数了:
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
static int register_jni_procs(const RegJNIRec array[], size_t count, JNIEnv* env)
{
//传递进来的RegJNIRec类型的数组gRegJNI里面存储的全是一些注册函数的函数指针,
//所以执行RegJNIRec的成员mProc,相当于执行对应的函数,去完成每个函数的注册动作。
for (size_t i = 0; i < count; i++) {
if (array[i].mProc(env) < 0) {
#ifndef NDEBUG
ALOGD("----------!!! %s failed to load\n", array[i].mName);
#endif
return -1;
}
}
return 0;
}
// RegJNIRec的定义
#ifdef NDEBUG
#define REG_JNI(name) { name }
struct RegJNIRec {
int (*mProc)(JNIEnv*);
};
#else
#define REG_JNI(name) { name, #name }
struct RegJNIRec {
int (*mProc)(JNIEnv*);
const char* mName;
};
#endif
//截取部分gRegJNI数组内容
static const RegJNIRec gRegJNI[] = {
REG_JNI(register_com_android_internal_os_RuntimeInit),
REG_JNI(register_com_android_internal_os_ZygoteInit_nativeZygoteInit),
REG_JNI(register_android_os_SystemClock),
REG_JNI(register_android_util_CharsetUtils),
…………
}
1.2.5、准备Java main函数的形参argv
准备要进入Java世界、调用Java的main函数了,但需要先把将要执行main函数的类名"com.android.internal.os.ZygoteInit",和前面添加的虚拟机设置相关的一堆option传递过去,所以这里需要准备一下,以String[]的形式传递。
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
jclass stringClass;
jobjectArray strArray;
jstring classNameStr;
stringClass = env->FindClass("java/lang/String"); //先找到Java的String类
assert(stringClass != NULL);
strArray = env->NewObjectArray(options.size() + 1, stringClass, NULL); //相当于strArray = new String[options.size() + 1];
assert(strArray != NULL);
//字符串需要转换为Java世界的UTF格式,相当于classNameStr = new String("com.android.internal.os.ZygoteInit");
classNameStr = env->NewStringUTF(className);
assert(classNameStr != NULL);
env->SetObjectArrayElement(strArray, 0, classNameStr); //相当于strArray[0] = classNameStr; 即"com.android.internal.os.ZygoteInit"
//把存储在Vector中的所有option都转换为Java世界的String类型,顺序存储到strArray中[1, options.size()]的位置
for (size_t i = 0; i < options.size(); ++i) {
jstring optionsStr = env->NewStringUTF(options.itemAt(i).string());
assert(optionsStr != NULL);
env->SetObjectArrayElement(strArray, i + 1, optionsStr);
}
…………
}
1.2.6、启动虚拟机
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
//将"com.android.internal.os.ZygoteInit"转化为"com/android/internal/os/ZygoteInit"格式
char* slashClassName = toSlashClassName(className != NULL ? className : "");
jclass startClass = env->FindClass(slashClassName); //根据路径找到ZygoteInit类
if (startClass == NULL) {
ALOGE("JavaVM unable to locate class '%s'\n", slashClassName);
} else {
jmethodID startMeth = env->GetStaticMethodID(startClass, "main",
"([Ljava/lang/String;)V"); //找到ZygoteInit类的static main方法
if (startMeth == NULL) {
ALOGE("JavaVM unable to find main() in '%s'\n", className);
} else {
env->CallStaticVoidMethod(startClass, startMeth, strArray); //执行ZygoteInit.main()函数
#if 0
if (env->ExceptionCheck())
threadExitUncaughtException(env);
#endif
}
}
…………
}
这里的动作就很好理解了,无非就是找到com/android/internal/os/ZygoteInit.java,然后执行该类的main函数,自此将进入Java世界。需要注意理解的是,根据代码中的注释,这里就是启动虚拟机的过程,当前线程也就成为了虚拟机的主线程,所以这个函数只有在虚拟机退出(比如崩溃)的时候才会return。
1.2.7、退出时释放资源
// pie\frameworks\base\core\jni\AndroidRuntime.cpp
void AndroidRuntime::start(const char* className, const Vector<String8>& options, bool zygote)
{
…………
free(slashClassName); //释放字符串所占空间
ALOGD("Shutting down VM\n"); //虚拟机崩溃或退出的时候才会执行到这里
if (mJavaVM->DetachCurrentThread() != JNI_OK) //将当前线程从虚拟机可见的线程集中分离
ALOGW("Warning: unable to detach main thread\n");
if (mJavaVM->DestroyJavaVM() != 0) //销毁前面创建的JavaVM
ALOGW("Warning: VM did not shut down cleanly\n");
}
到此为止zygote 在C/C++部分的流程就告一段落了,这一部分的调用流程总结如下图:
2、Welcome To Java
在上面我们分析了,C/C++世界Zygote相关的启动代码,在结尾处,终于在ZygoteInit.main()函数执行时,进入到了Java世界。所以这里接着main函数往下看,追踪Java世界中Zygote相关的内容,main()函数的代码依旧是分割开来解析 。
2.1、准备工作
// pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
public static void main(String[] argv) {
ZygoteServer zygoteServer = null;
//pie\libcore\dalvik\src\main\java\dalvik\system\ZygoteHooks.java
ZygoteHooks.startZygoteNoThreadCreation(); //调用native函数,功能是确保此时没有其他线程启动
try {
Os.setpgid(0, 0); //设置pid
} catch (ErrnoException ex) {
throw new RuntimeException("Failed to setpgid(0,0)", ex);
}
Runnable caller;
try {
final long startTime = SystemClock.elapsedRealtime(); //系统启动到现在的时间,包含设备深度休眠的时间
final boolean isRuntimeRestarted = "1".equals(
SystemProperties.get("sys.boot_completed")); //该属性值在设备物理重启时为空,reboot重启后为1
String bootTimeTag = Process.is64Bit() ? "Zygote64Timing" : "Zygote32Timing"; //设置boot时间打印TAG
//pie\frameworks\base\core\java\android\util\TimingsTraceLog.java
TimingsTraceLog bootTimingsTraceLog = new
TimingsTraceLog(bootTimeTag,Trace.TRACE_TAG_DALVIK); //通过systrace来追踪
bootTimingsTraceLog.traceBegin("ZygoteInit"); //追踪开始,每个traceBegin()对应一个traceEnd()
//使能DDMS(Dalvik Debug Monitor Server),注册所有已知的Java VM的处理块的监听器。
//线程监听、内存监听、native堆内存监听、debug模式监听…
RuntimeInit.preForkInit();
boolean startSystemServer = false;
String zygoteSocketName = "zygote";
String abiList = null;
boolean enableLazyPreload = false;
for (int i = 1; i < argv.length; i++) {
if ("start-system-server".equals(argv[i])) { //读取"start-system-server"参数
startSystemServer = true;
//ro.zygote属性值为zygote64_32或zygote64_32时,会存在另外一个进程zygote_secondary,
//zygote_secondary -Xzygote /system/bin --zygote --socket-name=zygote_secondary --enable-lazy-preload
} else if ("--enable-lazy-preload".equals(argv[i])) {
enableLazyPreload = true;
} else if (argv[i].startsWith(ABI_LIST_ARG)) { //读取"--abi-list"参数
abiList = argv[i].substring(ABI_LIST_ARG.length());
} else if (argv[i].startsWith(SOCKET_NAME_ARG)) { //读取"--socket-name"参数
zygoteSocketName = argv[i].substring(SOCKET_NAME_ARG.length());
} else {
throw new RuntimeException("Unknown command line argument: " + argv[i]);
}
}
// PRIMARY_SOCKET_NAME = "zygote"
final boolean isPrimaryZygote = zygoteSocketName.equals(Zygote.PRIMARY_SOCKET_NAME);
if (!isRuntimeRestarted) {
if (isPrimaryZygote) {
FrameworkStatsLog.write(FrameworkStatsLog.BOOT_TIME_EVENT_ELAPSED_TIME_REPORTED,
BOOT_TIME_EVENT_ELAPSED_TIME__EVENT__ZYGOTE_INIT_START,
startTime); //FrameworkStatsLog.java == statslog-framework-java-gen
//SECONDARY_SOCKET_NAME = "zygote_secondary"
} else if (zygoteSocketName.equals(Zygote.SECONDARY_SOCKET_NAME)) {
FrameworkStatsLog.write(FrameworkStatsLog.BOOT_TIME_EVENT_ELAPSED_TIME_REPORTED,
BOOT_TIME_EVENT_ELAPSED_TIME__EVENT__SECONDARY_ZYGOTE_INIT_START,
startTime);
}
}
if (abiList == null) {
throw new RuntimeException("No ABI list supplied.");
}
…………
这一部分主要是为后面的任务做准备工作:
- 禁止启动其他线程;
- 设置pid;
- 解析C/C++层传进来的参数argv;
- 设置相关日志追踪;
2.2、preload()
// pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
public static void main(String[] argv) {
…………
if (!enableLazyPreload) {
bootTimingsTraceLog.traceBegin("ZygotePreload");
EventLog.writeEvent(LOG_BOOT_PROGRESS_PRELOAD_START,SystemClock.uptimeMillis());
preload(bootTimingsTraceLog); //预加载
EventLog.writeEvent(LOG_BOOT_PROGRESS_PRELOAD_END,SystemClock.uptimeMillis());
bootTimingsTraceLog.traceEnd();
}
}
这里的预加载是指将Java类、资源文件、图像资源等公共资源在zygote启动的时候就进行加载。这样一来,根据fork的copy-on-write机制,其他由zygote fork出来的进程在使用这些资源的时候就不需要再次加载了,而是直接使用。所以这是一种牺牲系统开机时间,来提高系统应用运行时的运行效率的手段。
//pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
static void preload(TimingsTraceLog bootTimingsTraceLog) {
Log.d(TAG, "begin preload");
bootTimingsTraceLog.traceBegin("BeginPreload");
beginPreload(); //ZygoteHooks.onBeginPreload();
bootTimingsTraceLog.traceEnd(); //BeginPreload
bootTimingsTraceLog.traceBegin("PreloadClasses");
preloadClasses(); //预加载一些类
bootTimingsTraceLog.traceEnd(); //PreloadClasses
bootTimingsTraceLog.traceBegin("CacheNonBootClasspathClassLoaders");
//加载一些应用程序使用但不能放入引导类路径的jar包库,这些库过去是引导类路径的一部分,但必须删除。
//由于向后兼容性的原因,旧的系统应用程序仍然会使用它们,因此它们被缓存在这里以保持性能特征
cacheNonBootClasspathClassLoaders();
bootTimingsTraceLog.traceEnd(); //CacheNonBootClasspathClassLoaders
bootTimingsTraceLog.traceBegin("PreloadResources");
preloadResources(); //加载常用资源,以便它们可以跨进程共享,比如apk开发常用到的color、drawable等资源
bootTimingsTraceLog.traceEnd(); //PreloadResources
Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "PreloadAppProcessHALs");
nativePreloadAppProcessHALs(); //一些被大多数app进程加载的内容,需要通过HAL来添加(native)
Trace.traceEnd(Trace.TRACE_TAG_DALVIK);
Trace.traceBegin(Trace.TRACE_TAG_DALVIK, "PreloadGraphicsDriver");
maybePreloadGraphicsDriver(); //根据属性ro.zygote.disable_gl_preload来判断是否禁止预加载图像驱动相关内容(native)
Trace.traceEnd(Trace.TRACE_TAG_DALVIK);
preloadSharedLibraries(); //加载几个共享库:libandroid.so、libcompiler_rt.so、libjnigraphics.so
preloadTextResources(); //启动字体缓存,设置Typeface
WebViewFactory.prepareWebViewInZygote(); //为了内存共享,WebViewFactory执行所有必须在zygote进程中运行的初始化
endPreload();
warmUpJcaProviders(); //注册AndroidKeyStoreProvider并预热已经注册的provider
Log.d(TAG, "end preload");
sPreloadComplete = true;
}
其中的preloadClasses()函数是去加载目标设备目录树中,/system/etc/preloaded-classes这个文件中每行一个全限定名格式的类(#开头的注释行和空白行则自动跳过)。该文件是由文件frameworks\base\tools\preload\WritePreloadedClassFile.java自动生成,其对于哪些类需要预加载有明确的说明:
/*
* pie\frameworks\base\tools\preload\WritePreloadedClassFile.java
* The set of classes to preload. We preload a class if:
* a) it's loaded in the bootclasspath (i.e., is a system class) 1、即系统类
* b) it takes > MIN_LOAD_TIME_MICROS = 1250 us to load, and 2、加载时长超过1250ms的类
* c) it's loaded by more than one process, or it's loaded by anapplication 3、不止一个进程会去加载的类
*/
2.3、gcAndFinalize()
//pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
public static void main(String[] argv) {
…………
bootTimingsTraceLog.traceBegin("PostZygoteInitGC");
// 调用ZygoteHooks.gcAndFinalize(),通过runFinalizationSync()可以在没有HeapWorker线程的Zygote中调用finalizers,
//以运行几个特殊的gc来尝试清理几代软可及和最终可及的对象,以及任何其他垃圾。
gcAndFinalize();
bootTimingsTraceLog.traceEnd(); // PostZygoteInitGC
bootTimingsTraceLog.traceEnd(); // 对应bootTimingsTraceLog.traceBegin("ZygoteInit")
Zygote.initNativeState(isPrimaryZygote); //初始化zygote的native状态(native方法)
ZygoteHooks.stopZygoteNoThreadCreation(); //可以启动其他线程了,对应前面的ZygoteHooks.startZygoteNoThreadCreation();
…………
}
gcAndFinalize()方法主要就是在预加载动作之后、后续从zygote fork其他进程的动作之前,进行的一次垃圾回收。这里需要补充看一下上面这个代码段中的Zygote.initNativeState()方法:
// pie\frameworks\base\core\java\com\android\internal\os\Zygote.java
static void initNativeState(boolean isPrimary) {
nativeInitNativeState(isPrimary);
}
// pie\frameworks\base\core\jni\com_android_internal_os_Zygote.cpp
static void com_android_internal_os_Zygote_nativeInitNativeState(JNIEnv* env, jclass, jboolean is_primary) {
gZygoteSocketFD = android_get_control_socket(is_primary ? "zygote" : "zygote_secondary"); //获取socket的句柄fd
if (gZygoteSocketFD >= 0) {
ALOGV("Zygote:zygoteSocketFD = %d", gZygoteSocketFD);
} else {
ALOGE("Unable to fetch Zygote socket file descriptor");
}
gUsapPoolSocketFD = android_get_control_socket(is_primary ? "usap_pool_primary" : "usap_pool_secondary");
if (gUsapPoolSocketFD >= 0) {
ALOGV("Zygote:usapPoolSocketFD = %d", gUsapPoolSocketFD);
} else {
ALOGE("Unable to fetch USAP pool socket file descriptor");
}
//创建套接字,该套接字将被用来发送未经请求的消息到system_server,该套接字将在派生子进程后被关闭
initUnsolSocketToSystemServer();
gIsSecurityEnforced = security_getenforce(); //根据selinux策略,普通apk是禁止security_getenforce的,
selinux_android_seapp_context_init(); //所以在zygote fork之前初始化并缓存该策略值
//Zygote进程在fork每个子进程之前首先卸载根存储空间,因为Zygote进程不使用根存储空间,所以取消对其下面的挂载名称空间的共享。
//每个fork的子进程(包括SystemServer)只挂载它们自己的根存储空间,在MountEmulatedStorage方法中不需要卸载存储操作。
UnmountStorageOnInit(env);
if (!SetTaskProfiles(0, {})) { //加载必须的performance profile信息
zygote::ZygoteFailure(env, "zygote", nullptr, "Zygote SetTaskProfiles failed");
}
}
该函数的功能概括来讲做了这四件事:
- 从环境变量中获取socket句柄fd;
- 初始化安全属性;
- 卸载适当的存储;
- 加载必要的性能概要信息;
还有需要说明一下的是代码里出现的USAP(Unspecialized App Process),是指在android高版本里提出来的一种zygote fork子进程的机制。通过prefork的方式提前创建好一批进程,当有应用启动时,直接将已经创建好的进程分配给它,从而省去了fork的动作,从而可以提升性能。详情参考《Android Framework | 一种新型的应用启动机制:USAP》。
2.4、 forkSystemServer()
前面的三个小节做好准备工作后,下面就要开始做zygote比较重要的的一个任务了,那就是fork出system_server进程:
//pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
public static void main(String[] argv) {
…………
zygoteServer = new ZygoteServer(isPrimaryZygote); //创建zygote的ServerSocket
if (startSystemServer) {
Runnable r = forkSystemServer(abiList, zygoteSocketName, zygoteServer);
if (r != null) { //{r == null} in the parent process, and {r != null} in the child process
r.run(); //通过反射机制执行SystemServer.java的main()函数
return;
}
}
…………
}
forkSystemServer的具体细节请参考我《Android9.0(Pie) system_server进程学习》一文。我们只需要大概知道,这里zygote首先fork出了它的第一个进程,然后将该进程改名为system_server。在该进程中加载了类加载器,然后通过反射机制找到SystemServer.java的main函数,并封装到Runnable类型的r中。最后回到上面的代码,通过r.run()执行该main方法,以启动SystsmServer的java类。
2.5、runSelectLoop()
zygote除了fork出system_server进程这个任务外,还有一个重要的任务,那就是接收AMS(ActivityManagerService)发来创建java层应用程序的请求,fork出一个个进程,并在新进程中执行该请求中相关应用程序的main方法。上层的一个个应用程序就是这样通过zygote创建而来,因为应用程序都是由zygote孕育而来,所以就不难理解zygote(受精卵)的名称的由来了。我们继续往下看看它是如何完成这一任务的:
// pie\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java
public static void main(String[] argv) {
…………
Runnable caller;
try {
…………
Log.i(TAG, "Accepting command socket connections");
caller = zygoteServer.runSelectLoop(abiList);
} catch (Throwable ex) {
Log.e(TAG, "System zygote died with fatal exception", ex);
throw ex;
} finally {
if (zygoteServer != null) {
zygoteServer.closeServerSocket(); //zygote挂掉的时候关闭ServerSocket
}
}
if (caller != null) {
caller.run();
}
}
runSelectLoop()方法冗长,有太多USAP相关的操作,我们这里省略相关内容,只看核心操作:
// pie\frameworks\base\core\java\com\android\internal\os\ZygoteServer.java
Runnable runSelectLoop(String abiList) {
ArrayList<FileDescriptor> socketFDs = new ArrayList<>();
ArrayList<ZygoteConnection> peers = new ArrayList<>();
socketFDs.add(mZygoteSocket.getFileDescriptor()); //先将server socket加入到这个socketFDs列表
peers.add(null);
while (true) { //间隔时间持续轮询
…………
int[] usapPipeFDs = null;
StructPollfd[] pollFDs;
pollFDs = new StructPollfd[socketFDs.size()]; //每轮循环,都重新创建需要监听的pollFDs
int pollIndex = 0;
for (FileDescriptor socketFD : socketFDs) {
pollFDs[pollIndex] = new StructPollfd();
pollFDs[pollIndex].fd = socketFD;
pollFDs[pollIndex].events = (short) POLLIN; //关注poll事件到来
++pollIndex;
}
…………
int pollTimeoutMs;//设置poll轮询时延间隔
int pollReturnValue;
try {
pollReturnValue = Os.poll(pollFDs, pollTimeoutMs);
…………
if (pollReturnValue == 0) { …………
} else {
while (--pollIndex >= 0) {
if ((pollFDs[pollIndex].revents & POLLIN) == 0) {
continue;
}
if (pollIndex == 0) { //server socket最先加入fds, 因此这里是server socket收到数据
ZygoteConnection newPeer = acceptCommandPeer(abiList); //收到新的建立通信的请求,建立通信连接
peers.add(newPeer); //加入到peers和fds, 即下一次也开始监听
socketFDs.add(newPeer.getFileDescriptor());
} else if (pollIndex < usapPoolEventFDIndex) { //说明接收到AMS通过socket发送过来创建应用程序的请求
try {
//有socket连接时创建ZygoteConnection对象,并添加到pollFDs
ZygoteConnection connection = peers.get(pollIndex);
boolean multipleForksOK = !isUsapPoolEnabled()
&& ZygoteHooks.isIndefiniteThreadSuspensionSafe();
final Runnable command =
connection.processCommand(this, multipleForksOK); //完成创建子进程的请求
if (mIsForkChild) {
if (command == null) {
throw new IllegalStateException("command == null");
}
return command; //依然是提供Runnable接口,通过反射机制执行目标应用程序的main方法
} else {
if (command != null) {
throw new IllegalStateException("command != null");
}
//处理完后,关闭socket连接,并从peers和socketFDs列表中移除
if (connection.isClosedByPeer()) {
connection.closeSocket();
peers.remove(pollIndex);
socketFDs.remove(pollIndex);
}
}
} catch (Exception e) {
…………
}
这里大概意思就是,循环间隔一段时间轮询连接socket消息,看是否有AMS客户端发过来创建应用程序的请求,有的话则通过pie\frameworks\base\core\java\com\android\internal\os\ZygoteConnection.processCommand()方法创建进程并启动目标应用程序。我们只需要直到这里是接收AMS创建应用程序的请求,完成目标应用程序创建与启动的就好。详细细节我后面学习到AMS之后,单独写一篇文章来追踪AMS与zygote之间通过socket通信,创建应用程序的过程吧。
3、结语
总结来说,zygote在开机过程中,其先是启动虚拟机、注册JNI函数、进入java世界,然后fork出system_server进程,之后作为守护进程监听并处理创建普通应用程序的工作。原图请见:Pie_Zygote | ProcessOn免费在线作图,在线流程图,在线思维导图 |