Systrace 响应速度实战 3 :响应速度延伸知识

在讨论 Android 性能问题的时候,卡顿响应速度ANR 这三个性能相关的知识点通常会放到一起来讲,因为引起卡顿、响应慢、ANR 的原因类似,只不过根据重要程度,被人为分成了卡顿、响应慢、ANR 三种,所以我们可以定义广义上的卡顿,包含了卡顿、响应慢和 ANR 三种,所以如果用户反馈说手机卡顿或者 App 卡顿,大部分情况下都是广义上的卡顿,需要搞清楚,到底出现了哪一种问题

如果是动画播放卡顿、列表滑动卡顿这种,我们一般定义为 狭义的卡顿,对应的英文描述我觉得应该是 Jank;如果是应用启动慢、亮灭屏慢、场景切换慢,我们一般定义为 响应慢 ,对应的英文描述我觉得应该是 Slow ;如果是发生了 ANR,那就是 应用无响应问题 。三种情况所对应的分析方法和解决方法不太一样,所以需要分开来讲

另外在 App 或者厂商内部,卡顿响应速度ANR 这几个性能指标都是有单独的标准的,比如 掉帧率启动速度ANR 率等,所以针对这些性能问题的分析和优化能力,对开发者来说就非常重要了

本文是响应速度系列的第三篇,主要是讲在使用 Systrace 分析应用响应速度问题的时候,其中的一些延伸知识,包括启动速度测试、Log 输出解读、Systrace 状态解读、三方启动库等内容

Systrace (Perfetto) Systrace 基础知识系列

系列文章

  1. Systrace 响应速度实战 1 :了解响应速度原理

  2. Systrace 响应速度实战 2 :响应速度实战分析-以启动速度为例

  3. Systrace 响应速度实战 3 :响应速度延伸知识(本文)

  4. Systrace 基础知识系列-放个链接在这里方便大家直接点过去

1. Systrace 中进程三种状态解读

Systrace 中,进程的任务最常见的有三种状态:Sleep、Running、Runnable。在优化的过程中,这几个状态也需要我们关注。进程任务状态在最上面,以颜色来做区分:

  1. 绿色:Running

  2. 蓝色:Runnable

  3. 白色:Sleep

1.1 如何分析 Sleep 状态的 Task

一般白色的 Sleep 有两种,即应用主动 Sleep 和被动 Sleep

  1. nativePoll 这种,一般属于主动 Sleep,因为没有消息处理了,所以进入 Sleep 状态等待 Message,这种一般是正常的,我们不需要去关注。比如两帧之间的那段,就是主动 sleep 的

  2. 被动 Sleep 一般是由用户主动调用 sleep,或者用 Binder 与其他进程进行通信,这个是我们最常见的,也是分析性能问题的时候经常会遇到的,需要重点关注

如下图,这种在启动过程中,有较长时间的 sleep 情况,一般下面就可以看到是否在进行 Binder 通信,如果在启动过程中有频繁的 Binder 通信,那么应用等待的时间就会变长,导致响应时间变慢

3a3d0be7108a1c6cf9192918cbb6cc64.png

这种一般可以点击这个 Task 最下面的 binder transaction 来查看 Binder 调用信息,比如

ec67e3bfb847fa5f3c5d3af0d4103b33.png

有时候没有 Binder 信息,是被其他的等待的线程唤醒,那么可以查看唤醒信息,也可以找到应用是在等待什么

6b15e9f3d33d8a962292b350cac32189.png

放大上图中我们点击的 Runnable 的地方

95c870c299fc3dded20612c2ae6b8757.png

1.2 如何分析 Running 状态的 Task

Running 状态的任务就是目前在 CPU 某一个核心上运行的任务,如果某一段任务是 Running 状态,且耗时变长,那么需要分析:

  1. 是否应用的本身逻辑耗时,比如新增了某些代码逻辑

  2. 是否跑在了对应的核心上

0e07ccc7d32418682755cfcd1a658dbe.png 784b27505ea3c96b1664d216758e9d3f.png

在某些 Android 机器上,大家一般会对 App 的主线程和渲染线程进行调度方面的优化:一般前台应用的 UI Thread 和 RenderThread 都是跑在大核上的

1.3 如何分析 Runnable 状态的 Task

一个 Task 要从 Sleep 状态转到 Running 状态,必须先变成 Runnable 状态,其状态转换图如下

146bbe72dc62fb4c2be75ac88fced839.png

在 Systrace 上的表现如下

d4759c68be20d9884d7e5099eb646664.png

正常情况下,应用进入 Runnable 状态之后,会马上被调度器调度,进入 Running 状态,开始干活;但是在系统繁忙的时候,应用就会有大量的时间在 Runnable 状态,因为 cpu 已经跑满,各种任务都需要排队等待调度

如果应用启动的时候出现大量的 Runnable 任务,那么需要查看系统的状态

2. TraceView 工具在响应速度方面的使用

TraceView 指的是我们在 AS Profiler 里面抓取 CPU 信息的时候出现的那个,大家看下面的截图就知道了

df80f94b2cd54e037f609689076ce70f.png

2.1 如何抓取应用启动时候的 TraceView

使用下面的命令可以抓取应用的冷启动,这些命令也可以分开执行,需要把里面的包名和 Activity 名切换成自己应用的包名

adb shell am start -n com.aboback.wanandroidjetpack/.splash.SplashActivity --start-profiler /data/local/tmp/traceview.trace --sampling 1 && sleep 10 && adb shell am profile stop com.aboback.wanandroidjetpack && adb pull /data/local/tmp/traceview.trace .

或者分开执行上面的命令

// 1. 冷启动 App,sampleing = 1 意思是 1ms 采样一次
adb shell am start -n com.aboback.wanandroidjetpack/.splash.SplashActivity --start-profiler /data/local/tmp/traceview.trace --sampling 1

// 2. 等待应用完全启动之后,结束 profile
adb shell am profile stop com.aboback.wanandroidjetpack

// 3. 将 Trace 文件从手机里面 pull 出来
adb pull /data/local/tmp/traceview.trace .

// 4. 使用 Android Studio 打开 traceview.trace 文件

2.2 TraceView 工具怎么看

抓出来的 TraceView 可以直接在 Android Studio 中打开

其中图里面用绿色标记的函数,就是应用自己的函数,黄色标注的是系统的函数

Application.onCreate

414ad723b9be5a3b99b03220c3a7cdcb.png

Activity.onCreate

b9c4d0da22d8473c6e601ff9d1885c05.png

doFrame

37b7b40e8f33365fd83fb909e708d2a2.png

WebView 初始化

0f82f065422a228bfe2b4024f1d592d8.png

2.3 TraceView 工具的弊端

由于采样比较细,所以会性能损耗比较大,所以抓出来的 TraceView,其中每个方法的执行时间是不准的,所以不可用作为真实的时间参考,但是可以用来定位具体的函数调用栈。

需要跟 Systrace 来进行互补

3. SimplePerf 工具在启动速度分析的使用

使用 SimplePerf 工具也可以抓取启动时候的堆栈信息,既包括 Java 也包括 Native

比如我们要抓取 com.aboback.wanandroidjetpack 这个应用的冷启动,可以执行下面的命令(SimplePerf 的环境初始化参考 https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/android_application_profiling.md 这篇文章 ,其中 app_profiler.py 就是 SimplePerf 的工具)

python app_profiler.py -p com.aboback.wanandroidjetpack

执行上面的命令之后,需要手动在手机上启动 App,然后主动结束

$ python app_profiler.py -p com.aboback.wanandroidjetpack
INFO:root:prepare profiling
INFO:root:start profiling1
INFO:root:run adb cmd: ['adb', 'shell', '/data/local/tmp/simpleperf', 'record', '-o', '/data/local/tmp/perf.data', '-e task-clock:u -f 1000 -g --duration 10', '--log', 'info', '--app', 'com.aboback.wanandroidjetpack']                                simpleperf I environment.cpp:601] Waiting for process of app com.aboback.wanandroidjetpack
simpleperf I environment.cpp:593] Got process 32112 for package com.aboback.wanandroidjetpack

抓取结束之后,调用解析脚本来生成 html 报告

python report_html.py

就会得到下面这个

da462c7b01320d5a7cd2a6fe9bbfc2d8.png

不仅可以看到 Java 层的堆栈,也可以看到 Native 的堆栈,这里只是简单的使用,更详细的方法可以参考下面几个文档

SimplePerf 初步试探 https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/README.md

  1. Android application profiling https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/android_application_profiling.md

  2. Android platform profiling https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/android_platform_profiling.md

  3. Executable commands reference https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/executable_commands_reference.md

  4. Scripts reference https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/scripts_reference.md

4. 其他组件启动时在 Systrace 中的位置

4.1 Service 的启动

public final void scheduleCreateService(IBinder token,
        ServiceInfo info, CompatibilityInfo compatInfo, int processState) {
    updateProcessState(processState, false);
    CreateServiceData s = new CreateServiceData();
    s.token = token;
    s.info = info;
    s.compatInfo = compatInfo;
    sendMessage(H.CREATE_SERVICE, s);
}

public final void scheduleBindService(IBinder token, Intent intent,
        boolean rebind, int processState) {
    updateProcessState(processState, false);
    BindServiceData s = new BindServiceData();
    s.token = token;
    s.intent = intent;
    s.rebind = rebind;
    sendMessage(H.BIND_SERVICE, s);
}

可以看到,代码执行都是往 H 这个 Handler 中发送 Message,所以如果我们在代码里面启动 Service,并不是马上就执行的,而是由 MessageQueue 里面的 Message 顺序决定的

13893517e0dfca650e0c93af99399ad8.png

放大真正执行的部分可以看到,其执行的时机是在 MessageQueue 按照 Message 的顺序执行(这里是在应用第一帧执行结束后),后面的 Message 就是应用自己的 Message、启动 Service、执行广播接收器

3ebdd94910cd7b887ce96aba5be40693.png

4.2 执行自己的 Message

执行自定义的 Message 在 Systrace 中的显示

d7aac940b15026aeeee1a664b1a69724.png

4.3 启动 Service

Service 启动在 Systrace 中的显示

b7f56458c054a4e7a67295bda6bf43a2.png

4.4 启动 BroadcastReceiver

执行 Receiver 在 Systrace 中的显示

dc17de54e31d2f0bfcda41709786fdeb.png

Broadcast 的注册:一般是在 Activity 生命周期函数中注册,在哪里注册就在哪里执行

9164abf35f8a2b01bb334e69629376a2.png

4.5 ContentProvider 的启动时机

426db1c4f15b7b90bfbba6c7309d467e.png 3937f98209648a60a421a3f4505d8210.png

5. AppStartup 是否能优化启动速度?

三方库的初始化

很多三方库都需要在 Application 中进行初始化,并顺便获取到 Application 的上下文

但是也有的库不需要我们自己去初始化,它偷偷摸摸就给初始化了,用到的方法就是使用 ContentProvider 进行初始化,定义一个 ContentProvider,然后在 onCreate 拿到上下文,就可以进行三方库自己的初始化工作了。而在 APP 的启动流程中,有一步就是要执行到程序中所有注册过的 ContentProvider 的 onCreate 方法,所以这个库的初始化就默默完成了。

这种做法确实给集成库的开发者们带来了很大的便利,现在很多库都用到了这种方法,比如 Facebook,Firebase,WorkManager

ContentProvider 的初始化时机如下:

730a2ae6218c28a1b3174ffef8379d24.png

但是当大部分三方库使用这种方法初始化的时候,就会有下面几个问题

  1. 启动过程中的 ContentProvider 过多

  2. 应用开发者无法控制使用这种方式初始化的库的初始化时机

  3. 无法处理这些三方库的依赖

AppStartup 库

针对上面的情况,Google 推出了 AppStartup 库,AppStartup 库的优点

  • 可以共享单个 Contentprovider

  • 可以明确地设置初始化顺序

  • 通过这个库可以移除三方库的 ContentProvider 启动时候自动初始化的步骤,手动通过 LazyLoad 的方式启动,这样可以起到优化启动速度的作用

根据测算结果来看,使用 AppStartup 库并不能显著加快应用启动速度,除非你有非常多 (50+)的 ContentProvider 在应用启动的时候初始,那么 AppStartup 才会有比较明显的效果

如果三方的 SDK 使用 ContentProvider 初始化耗时,那么可以考虑针对这个 ContentProvider 进行延迟初始化,比如

<provider
    android:name="androidx.startup.InitializationProvider"
    android:authorities="${applicationId}.androidx-startup"
    android:exported="false"
    tools:node="merge">
    <meta-data android:name="com.example.ExampleLoggerInitializer"
              tools:node="remove" />
</provider>

ExampleLoggerInitializer 的 meta-data 当中加入了一个 tools:node="remove"的标记

总结

  1. App Startup 的设计是为了解决一个问题:即不同的库使用不同的 ContentProvider 进行初始化,导致 ContentProvider 太多,管理杂乱,影响耗时的问题

  2. App Startup 具体能减少多少耗时时间:根据测试,如果二三十个三方库都集成了 App Startup,减少的耗时大概在 20ms 以内

  3. App Startup 的使用场景应该

    1. APK 有很多的 ContentProvider 在启动时候初始化

    2. APK 中有的三方库 ContentProvider 初始化很耗时,但是又不是必须要在启动的时候初始,可以按需初始化

    3. 应用开发者想自己控制各个库的初始化时机或者初始化顺序

需要 App 开发同学验证
  1. 检查打包出来的 apk 的配置文件里面看一下,有多少个三方库是利用 ContentProvider 初始化的(或者在 AS 的 src\main\AndroidManifest.xml 文件最下面打开 Merged Manifest 标签查看)

  2. 确认这些 ContentProvider 在启动时候的耗时

  3. 确认哪些 ContentProvider 可以延迟加载或者用时加载

  4. 如果需要的话,接入 AppStartup 库

6. IdleHandler 在 App 启动场景下的使用

在启动优化的过程中,idleHandler 可以在 MessageQueue 空闲的时候执行任务,如下图,可以很清晰地查看 idleHandler 的执行时机

9a58e7e7632d1236515ed33f23946723.png

其使用场景如下:

  1. 在启动的过程中,可以借助 idleHandler 来做一些延迟加载的事情。 比如在启动过程中 Activity 的 onCreate 里面 addIdleHandler,这样在 Message 空闲的时候,可以执行这个任务1aae59461f1a37e8764e061922e2c91b.png

  2. 进行启动时间统计:比如在页面完全加载之后,调用 activity.reportFullyDrawn 来告知系统这个 Activity 已经完全加载,用户可以使用了,比如下面的例子,在主页的 List 加载完成后,调用 activity.reportFullyDrawn8e58f245df103ea9dcfeb6632d02b53c.png

    其对应的 Systrace 如下

    95f2c653ee5aee4ef24feace53fe78c6.png这时候得到的应用的冷启动时间才是正常的8323604c5cb1904c4dcf81ecb9bd8a9e.png

另外系统有些功能,也会依赖于 FullyDrawn,所以建议主动上报(即主动在 App 完全启动后调用 activity.reportFullyDrawn),会有一些额外的收益,比如加快启动速度(iorap)

参考文章

  1. Android 应用启动全流程分析 :https://www.jianshu.com/p/37370c1d17fc

  2. 探究 | App Startup 真的能减少启动耗时吗:https://juejin.cn/post/6907493155659055111

  3. Jetpack 新成员,App Startup 一篇就懂 :https://blog.csdn.net/guolin_blog/article/details/108026357

  4. App Startup :https://developer.android.google.cn/topic/libraries/app-startup

  5. Android App 启动优化全记录 :https://www.androidperformance.com/2019/11/18/Android-App-Lunch-Optimize/

  6. Android application profiling :https://android.googlesource.com/platform/system/extras/+/master/simpleperf/doc/android_application_profiling.md)

欢迎大家点赞、在看、分享转发到朋友圈(由于微信的限制,文章部分超链接不可用,可用点击原文转到博客文章页面)

另外上次新建的微信群已经满了,需要新建一个微信群,主要是方便大家进行技术交流和技术分享,已经加入了其他群的小伙伴就可以不用加了(当然如果你乐于分享和交流技术乐于帮助人,也可以扫码加入,最好的学习手段就是:给别人讲懂,这也是费曼学习法推崇的,群友总会有各种各样的问题,回答或者看别人回答,自己总会有收获),如果超过 200 人的话就需要邀请了,可以加我的微信(553000664) ,备注加群即可

c3454ef7c7ffb4900d1a9b2c00e16b78.png

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Android Systrace是一种用于分析Android系统性能的工具。它可以捕获系统的各种事件和跟踪信息,并将其可视化为时间轴图形,以便开发人员更好地了解系统的行为和性能瓶颈。Systrace可以用于分析应用程序、系统服务和内核模块的性能问题,帮助开发人员优化应用程序和系统性能。Systrace的使用需要一定的技术和经验,但是掌握了基础知识后,可以大大提高开发效率和应用程序性能。 ### 回答2: Android systrace 是一个用于分析和优化 Android 系统性能的工具。它可以帮助开发者检测出系统的性能问题并提供解决方案。以下是关于 systrace 的一些基础知识: 1. systrace 的作用:systrace 可以跟踪和显示系统的各个组件之间的交互,并提供详细的性能数据。通过分析 systrace 数据,开发者可以定位和解决应用程序在运行过程遇到的性能瓶颈问题。 2. systrace 的使用方法:通过命令行或 Android Studio 的性能分析工具可以使用 systrace。开发者可以选择要捕获的系统事件和应用程序组件,然后生成一份包含性能数据的报告。报告包含的信息有 CPU 使用率、线程活动、绘制时间、电源管理、内存使用等。 3. systrace 的视图:systrace 报告包含多个视图,每个视图都显示不同的性能数据。常用的视图包括 CPU、渲染、电源、内存和启动视图。开发者可以根据需求选择并分析相应的视图。 4. systrace 的优化策略:通过 systrace 分析数据,开发者可以找到系统性能的瓶颈,并通过一些优化策略来提升性能。例如,优化 CPU 使用率、减少线程活动、优化绘制时间、减少内存使用等。 总之,Android systrace 是一种强大的分析工具,能够帮助开发者检测和解决 Android 系统的性能问题。掌握 systrace 的使用方法和相关的性能优化策略,对于开发高质量的 Android 应用程序非常重要。 ### 回答3: Android Systrace是一个用于分析和优化Android系统性能的工具。它通过收集系统的实时跟踪数据来显示对系统资源的使用和各个进程、线程的活动情况进行分析。 使用Systrace前,需要在设备上启用“开发者选项”并连接到计算机上。然后,在命令行运行"adb shell"进入设备的shell环境,使用"atrace"命令来启动SystraceSystrace会将跟踪数据保存到一个trace文件Systrace可以用于分析多个方面的性能问题,包括CPU使用率、渲染性能、I/O操作、电池使用情况等。通过图形界面或命令行工具,可以查看trace文件并找出性能瓶颈所在。 Systrace的图形界面提供了一些工具和选项来帮助分析性能问题。例如,可以通过选择不同的时间段来查看特定时间段内的性能数据,也可以使用颜色编码和热力图来显示不同进程和线程的活动情况。 在使用Systrace进行性能优化时,需要注意以下几点: 1. 确定关注的性能指标,例如CPU使用率、内存占用等。 2. 分析trace文件时,要注意特定进程和线程的活动情况,找出可能的性能瓶颈。 3. 通过与其他工具(如Android Studio的Profiler)结合使用,可以更全面地分析和优化系统性能。 总之,Android Systrace是一个强大的性能分析工具,能够帮助开发者发现和解决Android系统的性能问题,提高应用的用户体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值