🔥 什么是 ANR 🔥
ANR
(Application Not Responding )
应用无响应的简称,是为了在APP
卡死时,用户 可以强制退出APP
的选择,从而避免卡机无响应问题,这是Android
系统的一种自我保护机制。
在
Android
中,应用程序响应由Activity Manager
和Window Manager
系统服务进行监视。ANR(Application Not Responding )
,则是Android
的一种自我保护措施,当主线程出现卡顿时候,Android
系统会给用户一个弹出提示,让用户手动选择继续等待还是强制关闭此APP
。
🔥 ANR 类型 🔥
按键响应分发超时(Key Dispatch Timeout) 默认 5 s
,超过则会出现ANR。广播超时(Broadcast Timeout) 默认 10 s
,超过则会出现ANR。服务超时(Service Timeout) 默认 20 s
,超过则会出现ANR。
KeyDispatchTimeout(常见)
input事件在5S内没有处理完成发生了ANR。
logcat日志关键字:Input event dispatching timed out
BroadcastTimeout
前台Broadcast:onReceiver在10S内没有处理完成发生ANR。
后台Broadcast:onReceiver在60s内没有处理完成发生ANR。
logcat日志关键字:Timeout of broadcast BroadcastRecord
ServiceTimeout
前台Service:onCreate,onStart,onBind等生命周期在20s内没有处理完成发生ANR。
后台Service:onCreate,onStart,onBind等生命周期在200s内没有处理完成发生ANR
logcat日志关键字:Timeout executing service
ContentProviderTimeout
ContentProvider 在10S内没有处理完成发生ANR。
logcat日志关键字:timeout publishing content providers
🔥 产生原因 🔥
在
Android
系统中,APP
通常运行在一个UI Thread
或者叫MainThread
里。并且Android
中只有一个MainThread
和Main Message Queue
。MainThread
主要用于UI
的绘制、事件响应,监听与接收事件处理等功能。Main Message Queue
主要存放用户要处理消息的队列,主线程MainThread
从消息队列Main Message Queue
中取消息Message
后,尽快分发下去,一旦某条消息分发超时,则ANR
可能发生。
1、主线程进行耗时操作:如数据库读写、IO读写、网络请求等
2、多线程操作的死锁,主线程被block;
3、主线程被Binder 对端block;
4、System Server中WatchDog出现ANR;
5、service binder的连接达到上线无法和和System Server通信
6、系统资源已耗尽(管道、CPU、IO)
🔥 从以下几个疑问点进行分析 🔥
1、为什么
APP
不能获取CPU
时间片?
2、APP
是否是等待一些没能及时处理的事件完成?3、消息处理流程是不是太复杂?
🔥 常见解决方案 🔥
1.在主线程里尽可能的少做事,将耗时操作都放到子线程中执行。特别是在Acitivty生命周期(onCreate/onResume())里减少创建操作,潜在的耗时操作。(网络请求、数据库操作、计算位图尺寸等)放到子线程,然后通过Handler提交到主线程,而不是wait()sleep()等在那
2.别再广播里做耗时操作。放到Service里或者子线程。
3.如果真有耗时操作的话,可以做一个进度条,避免用户以为死机了。
🔥 分析解决 ANR问题 🔥
在分析
ANR
时有一些常见的模式可供选择:
APP
正在主线程上进行缓慢的I/O
操作。
APP
正在主线程中进行很复杂的计算操作主线程正在对另一个进程执行同步
Binder
程序调用,但另一个进程需要很长时间才能返回结果。主线程在等待另一个正在长时间执行块操作的子线程时被阻塞。
主线程因为另一个线程死锁,无论是
Bind
调用还是主线程调用,都不能让主线程等待很久,更不能在主线程中进行复杂的计算。知道产生ANR的原因,那么如何避免ANR 问题呢?
Strict mode
使用
StrictMode
可以帮助您在开发应用程序时在主线程上发现意外的I/O
操作。 您可以在application
或activity
使用StrictMode
。
关闭 ANR Dialog 提示
查看方法ANR控制的方法:设置---- 开发者选项---
显示所有ANR
注意 :
如没有开发者选项,请进入设置---关于手机--- 多次连击 版本号 即可打开隐藏的开发者选项
Traceview
Traceview获取正在运行的应用程序的跟踪信息,分析此
traces.txt
文件 可以推测出主线程在忙于某些事情。
traces
文件通常保存在/data/anr/traces.txt
下,你可以直接用adb cat
查看,或者adb pull
出来都可以。adb root adb remount adb pull /data/anr/traces.txt .
🔥 ANR 问题分析解决建议 🔥
1. 耗时操作
请放在工作线程中进行,可以使用
Handler、AsyncTask
等。
2. IO 操作
(比如:网络操作、存储操作等)也是引起ANR的常见因素。强烈建议在工作线程中进行。
3. 程序锁竞争
某些情况,
ANR
产生的原因不是直接因为在主线程中产生的。 比如: 工作线程对某个资源
等上锁,恰好此时,主线程需要此资源
,如等待超时,则此时ANR可能发生。
4. 死锁
当主线程因为请求一个其他线程正在持有的资源而进入等待状态时,
ANR
可能会发生。
5. 广播接收慢
应用程序可以通过广播接收器响应广播消息,例如启用或禁用飞行模式或更改连接状态。 当应用程序花费太长时间来处理广播消息时,理论上超过10s 未处理完成,
ANR
可能会发生。
6.广播 ANR发生在下列情况下:
onReceive()
方法长时间未执行完毕。尽量避免在onReceive()
中进行耗时操作。onReceive 方法中进行耗时操作,超过10s 未处理,会引起ANR
广播接收者调用
goAsync()
方法并且未能在PendingResult
对象上调用finish()
。您的广播接收机可以使用
goAsync()
来通知系统需要更多的时间来处理消息。 但是,您应该在PendingResult
对象上调用finish()
。 以下示例显示如何调用finish()以让系统回收广播接收器并避免ANR:
如要处理的广播内容较多,请使用
IntentService
进行处理。
🔥 捕获与监控 🔥
在开发阶段出现ANR
在开发阶段出现还是比较好解决的,只需要看报错的日志就可以了。然后定位到具体的代码行数。没找到的话,可以找
/data/anr/traces.tet
文件,这个文件记录了ANR日志。
/data/anr/traces.tet
文件:
主要看1.CPU、用户态、内核态、IO的利用率。哪个利用率高了,就是那个出问题了。
2.堆栈的利用率。
3.看“main” 的报错情况,自己写的错误一般都在这。
线上部分手机出现ANR
1.集成第三方:bugly、蒲公英、极光等监控,在那看ANR发生的手机型号、错误日志等。然后去找同款手机去测试一下(没有可以去云测)
2.自己监控: FileObserver、watchdog、FileObserver
FileObserver是一个抽象类,定义一个子类去继承他,实现onEvent方法。然后监控/data/anr/这个目录下有没有新文件产生,有的话就说明有ANR,然后传到服务器上。
watchdog : android系统就用的这个
🔥 Crash监控 🔥
Crash也就是闪退。闪退分为Java层的闪退和native层的闪退。
Java层的Crash
闪退就是发生了没有捕获的异常,处理不了了,然后就弹一个框“程序崩溃”,然后app就退出了。
1.获取UncaughtExceptionHandler Thread.getDefaultUncaughtExceptionHandler();
2.实现UncaughtExceptionHandler接口
3.在这个方法里就有了uncaughtException
在这里可以将报错信息Throwable存到本地,然后发送给服务器(时间、手机型号、app版本等自己写)
然后最重要的还得调用系统的uncaughtException方法,不然程序虽然不会崩溃,但是会卡死、无限重启。
系统怎么处理的
RuntimeInit.java -> KillApplicationHandler
也是实现UncaughtExceptionHandler接口
两个步骤 :
在try里通过AMS弹窗
在finally里杀死app进程