一 概述
ANR (Application Not responding),是指应用程序未响应,Android 系统对于一些事件需要在一定的时间范围内完成,如果超过预定时间能未能得到有效响应或者响应时间过长,都会造成 ANR。一般地,这时往往会弹出一个提示框,告知用户当前 xxx 未响应,用户可选择继续等待或者Force Close。
那么哪些场景会造成 ANR 呢?
- Service Timeout:前台服务在 20s 内未执行完成
- BroadcastQueue Timeout:前台广播在 10s 内未执行完成
- ContentProvider Timeout:内容提供者,超时 10s
- InputDispatching Timeout:输入事件分发超时 5s,包括按键和触摸事件
触发 ANR 的过程可分为三个步骤:埋炸弹,拆炸弹,引爆炸弹
二 Service
Service Timeout 是位于 ”ActivityManager” 线程中的 AMS.MainHandler 收到 SERVICE_TIMEOUT_MSG 消息时触发。
对于 Service 有两类:
- 对于前台服务,则超时为 SERVICE_TIMEOUT = 20s
- 对于后台服务,则超时为 SERVICE_BACKGROUND_TIMEOUT = 200s
由变量 ProcessRecord.execServicesFg 来决定是否前台启动
2.1 埋炸弹
文章Android四大组件系列4 Service启动流程详细介绍了 Service 的启动流程。其中在 Service 进程 attach 到 system_server 进程的过程中会调用 realStartServiceLocked() 方法来埋下炸弹。
2.1.1 ActiveServices.realStartServiceLocked
ActiveServices.java
private final void realStartServiceLocked(ServiceRecord r,
ProcessRecord app, boolean execInFg) throws RemoteException {
......
//发送delay消息(SERVICE_TIMEOUT_MSG)
bumpServiceExecutingLocked(r, execInFg, "create");
try {
......
//最终执行服务的onCreate()方法
app.thread.scheduleCreateService(r, r.serviceInfo,
mAm.compatibilityInfoForPackageLocked(
r.serviceInfo.applicationInfo),
app.repProcState);
} catch (DeadObjectException e) {
......
} finally {
......
}
......
}
2.1.2 ActiveServices.bumpServiceExecutingLocked
ActiveServices.java
private final void bumpServiceExecutingLocked(ServiceRecord r,
boolean fg, String why) {
......
scheduleServiceTimeoutLocked(r.app);
......
}
void scheduleServiceTimeoutLocked(ProcessRecord proc) {
if (proc.executingServices.size() == 0 || proc.thread == null) {
return;
}
Message msg = mAm.mHandler.obtainMessage(
ActivityManagerService.SERVICE_TIMEOUT_MSG);
msg.obj = proc;
//当超时后仍没有remove该SERVICE_TIMEOUT_MSG消息,则执行service Timeout流程
mAm.mHandler.sendMessageDelayed(msg,
proc.execServicesFg ? (now+SERVICE_TIMEOUT) :
(now+ SERVICE_BACKGROUND_TIMEOUT));
}
该方法的主要工作是发送 delay 消息 (SERVICE_TIMEOUT_MSG)。炸弹已埋下,我们并不希望炸弹被引爆,那么就需要在炸弹爆炸之前拆除炸弹。
2.2 拆炸弹
在 system_server 进程 ActiveServices.realStartServiceLocked() 调用的过程会埋下一颗炸弹,超时没有启动完成则会爆炸。那么什么时候会拆除这颗炸弹的引线呢?我们来看经过 Binder 等进程间通信层层调用进入目标进程的主线程 handleCreateService() 函数。
2.2.1 ActivityThread.handleCreateService
ActivityThread.java
private void handleCreateService(CreateServiceData data) {
......
java.lang.ClassLoader cl = packageInfo.getClassLoader();
Service service = packageInfo.getAppFactory()
.instantiateService(cl, data.info.name, data.intent);
......
try {
//创建ContextImpl对象
ContextImpl context = ContextImpl.createAppContext(this, packageInfo);
context.setOuterContext(service);
//创建Application对象
Application app = packageInfo.makeApplication(false, mInstrumentation);
service.attach(context, this, data.info.name, data.token, app,
ActivityManagerNative.getDefault());
//调用服务onCreate()方法
service.onCreate();
mServices.put(data.token, service);
//拆除炸弹引线
ActivityManager.getService().serviceDoneExecuting(
data.token, SERVICE_DONE_EXECUTING_ANON, 0, 0);
} catch (Exception e) {
......
}
}
在这个过程会创建目标服务对象,并回调其 onCreate() 方法,紧接着再次经过 IPC 调用回到 system_server 来执行 serviceDoneExecuting。
2.2.2 ActiveServices.serviceDoneExecutingLocked
ActiveServices.java
private void serviceDoneExecutingLocked(ServiceRecord r,
boolean inDestroying, boolean finishing) {
......
if (r.executeNesting <= 0) {
if (r.app != null) {
r.app.execServicesFg = false;
r.app.executingServices.remove(r);
if (r.app.executingServices.size() == 0) {
//当前服务所在进程中没有正在执行的service
mAm.mHandler.removeMessages(
ActivityManagerService.SERVICE_TIMEOUT_MSG, r.app);
......
}
......
}
该方法的主要工作是当 service 启动完成,则移除服务超时消息 SERVICE_TIMEOUT_MSG。
2.3 引爆炸弹
前面介绍了埋炸弹和拆炸弹的过程,如果在炸弹倒计时结束之前成功拆卸炸弹,那么就没有爆炸的机会,但是世事难料,总有些极端情况下无法即时拆除炸弹,导致炸弹爆炸,其结果就是 App 发生 ANR。接下来,分析下炸弹爆炸的现场。
在 system_server 进程中有一个 Handler 线程,名叫 ”ActivityManager”。当倒计时结束便会向该 Handler 线程发送一条消息 SERVICE_TIMEOUT_MSG。
2.3.1 MainHandler.handleMessage
ActivityManagerService.java ::MainHandler
final class MainHandler extends Handler {
......
public void handleMessage(Message msg) {
switch (msg.what) {
case SERVICE_TIMEOUT_MSG: {