btrace 开源!基于 Systrace 高性能 Trace 工具

if (!isMainProcess) {

return;

}

if (mainThreadOnly) {

if (Thread.currentThread() == sMainThread) {

Trace.beginSection(methodId);

}

} else {

Trace.beginSection(methodId);

}

}

该方法仅能过滤我们为 App 方法插桩的 atrace 数据,系统层 atrace 数据无法过滤。为更彻底实现仅采集主线程数据,我们通过 PLT Hook 代理 atrace_begin_bodyatrace_end_body 实现,在该方法进入前,判断当前线程 id 是否为主线程,如果不是,则不记录该条数据,代码实现片段如下。

void proxy_atrace_begin_body(const char *name) {

BYTEHOOK_STACK_SCOPE();

if (gettid() == TraceProvider::Get().GetMainThreadId()) {

BYTEHOOK_CALL_PREV(proxy_atrace_begin_body, name);

}

}

void proxy_atrace_end_body() {

BYTEHOOK_STACK_SCOPE();

if (gettid() == TraceProvider::Get().GetMainThreadId()) {

BYTEHOOK_CALL_PREV(proxy_atrace_end_body);

}

}

针对降低性能损耗,RheaTrace 提供编译配置供用户选择,针对不同使用场景配置合理参数。

rheaTrace {

runtime {

mainThreadOnly false

startWhenAppLaunch true

atraceBufferSize “500000”

}

}

上述配置释义如下。

  1. mainThreadOnly:为 true 表示仅采集主线程 trace 数据。

  2. startWhenAppLaunch:是否 App 启动开始就采集 trace 数据。

  3. atraceBufferSize:指定内存存储 atrace 数据 ring buffer 的大小,如果其值过小会导致 trace 数据写入不完整,若您抓取多线程 trace 数据,建议将值设为百万左右量级;最小值为 1 万,最大值为 5 百万。

实用性提升

针对已有的 atrace 数据,额外拓展 IO 等信息;另外为通过 Python 脚本彻底解决方法因执行异常导致 trace 数据闭合异常问题,保证每个方法 trace 数据的准确性。

目前我们基于 JVMTI 方案,在 Android 8.0 及以上设备可以获取类加载以及内存访问相关 trace 数据,目前仅支持编译类型为 debuggable 的 App,目前处于实验功能,本文暂先不过多介绍。

IO 数据拓展

背景简介

在抖音启动性能优化时,我们曾统计冷启动的耗时,其中占比最长的是进程处于 D 状态(不可中断睡眠态,Uninterruptible Sleep ,通常我们用 PS 查看进程状态显示 D,因此俗称 D 状态)时间。此部分耗时占总启动耗时约 40%,进程为什么会被置于 D 状态呢?处于 uninterruptible sleep 状态的进程通常是在等待 IO,比如磁盘 IO,其他外设 IO,正是因为得不到 IO 响应,进程才进入 uninterruptible sleep 状态,所以要想使进程从 uninterruptible sleep 状态恢复,就得使进程等待 IO 恢复,类似如下。

c125eb238e001f2baa9b99e57414c35c.png

但在使用 Systrace 进行优化时仅能得到如上内核态的调用状态,却无法得知具体的 IO 操作是什么。

方案介绍

因此,我们专门设计一套获取 IO 耗时信息方案,其包括用户空间和内核空间两部分。

一是在用户空间,为采集所需 IO 耗时信息,我们通过 Hook IO 操作标准函数簇,包括 open,write,read,fsync,fdatasync 等,插入对应 atrace 埋点用于统计对应的 IO 耗时,以 fsync 为例。

0528c96745ee5e4c5ffcc9fe11c5c2d5.png

其对应 hook 代码逻辑如下:

int proxy_fsync(int fd) {

BYTEHOOK_STACK_SCOPE();

ATRACE_BEGIN_VALUE(“fsync:”, FileInfo(fd).c_str());

int ret = BYTEHOOK_CALL_PREV(proxy_fsync, fd);

ATRACE_END();

return ret;

}

二是在内核空间,除 systrace 或 atrace 可直接支持启用功能外,ftrace 还提供其他功能,并包含对调试性能问题至关重要的一些高级功能(需要 root 访问权限,通常也可能需要新内核)。我们基于此添加显示定制 IO 信息等功能,开启/sys/kernel/debug/tracing/events/android_fs节点下 ftrace 信息,用于收集 IO 相关的信息。内核空间 IO 信息是通过 python 脚本开启,详见 io_extender.py。

解决方法闭合错误问题

背景介绍

RheaTrace 会自动在每个方法入口、出口处分别插入 Trace#beginSection(String)Trace#endSection() ,一个方法有且只有一个入口,但会有多个出口,方法出口对应的结束字节码指令有 return 和 throw 等。

public static void testCrash() {

try {

testA();

} catch (Exception e) {

e.printStackTrace();

}

}

public static void testA() {

testB();

testC();

}

public static void testB() {

int ret = 2 / 0; // <----- crash event

testD(ret);

}

public static void testC() {

Log.d(“btrace”, “do some things.”);

}

public static void testD(int num) {

Log.d(“btrace”, "box size: " + num);

}

上面的代码很简单,即 testCrash -> testA -> testB,其中 testB 出现异常,最终是在 testCrash 中捕获。通过本示例可知,testA、testB 方法出口均未正常执行完成,这也就导致 trace 数据不闭合,生成的 trace 数据如下,从中可以看出,B 和 E 数量上并不匹配,且仅从 trace 上看,我们也无法知道 E 属于哪个方法。

5108949.231989: B|28045| TestCrash:a

5108949.232055: B|28045| TestCrash:b

5108949.232554: B|28045| TestCrash:c

5108949.232580: E|28045

方案介绍

为解决该问题,RheaTrace 做了取巧处理,方法的出口由插入 Trace#endSection()改为 Trace#beginSection(String)。那我们如何知道哪条 trace 是开始,哪条是结束?我们看如下示例。

5108949.231989: B|28045|B:TestCrash:a

5108949.232055: B|28045|B:TestCrash:b

5108949.232554: B|28045|B:TestCrash:c

5108949.232580: B|28045|E:TestCrash:a

如上 trace 数据,每个方法描述前都会加上 B:ET, B: 表示方法开始,E 表示方法 retrun 结束,T: 表示方法 throw 结束。然后通过 Python 脚本处理并还原正常 trace 数据。如此做以后,我们就可以明确知道方法开始和结束,同时针对异常结束方法,我们会做补全处理,处理后的 trace 数据如下。

5108949.231989: B|28045|TestCrash:a

5108949.232055: B|28045|TestCrash:b

5108949.232554: B|28045|TestCrash:c

5108949.232554: E|28045|TestCrash:c

5108949.232554: E|28045|TestCrash:b

5108949.232580: E|28045|TestCrash:a

关于 Python 脚本的处理过程,本文不做过多介绍,大家可以阅读相关源码即可。

RheaTrace 工作流程


流程概述

RheaTrace 作为线下性能分析利器,我们首先看下其整体工作流程。

a681d9fb78f317485bc2993dbd363d8c.png

如上文介绍,我们将 Systrace 中 atrace 数据做拦截,将其转存至我们自定义的文件中。

Systrace 格式

首先我们 Systrace 生成的 trace.html 中 atrace 数据格式。

-0     (-----) [001] d.h4 1308823.803921: sched_waking: comm=TimerDispatch pid=704 prio=97 target_cpu=001

-0     (-----) [001] dnh5 1308823.803929: sched_wakeup: comm=TimerDispatch pid=704 prio=97 target_cpu=001

-0     (-----) [001] d…2 1308823.803943: sched_switch: prev_comm=swapper/1 prev_pid=0 prev_prio=120 prev_state=R ==> next_comm=TimerDispatch next_pid=704 next_prio=97

-0     (-----) [003] d.s3 1308823.803980: sched_waking: comm=kworker/3:0 pid=11120 prio=120 target_cpu=003

-0     (-----) [003] d.s4 1308823.803986: sched_blocked_reason: pid=11120 iowait=0 caller=worker_thread+0x4fc/0x804

TimerDispatch-704   (  643) [001] … 1308823.803988: tracing_mark_write: B|643|TimerIteration #9392

-0     (-----) [003] dns4 1308823.803988: sched_wakeup: comm=kworker/3:0 pid=11120 prio=120 target_cpu=003

TimerDispatch-704   (  643) [001] … 1308823.803992: tracing_mark_write: E|643

-0     (-----) [003] d…2 1308823.803997: sched_switch: prev_comm=swapper/3 prev_pid=0 prev_prio=120 prev_state=R ==> next_comm=kworker/3:0 next_pid=11120 next_prio=120

TimerDispatch-704   (  643) [001] … 1308823.804011: tracing_mark_write: C|643|VSP-mode|0

TimerDispatch-704   (  643) [001] … 1308823.804014: tracing_mark_write: C|643|VSP-timePoint|405332069786762

TimerDispatch-704   (  643) [001] … 1308823.804016: tracing_mark_write: C|643|VSP-prediction|405332075389317

TimerDispatch-704   (  643) [001] … 1308823.804022: tracing_mark_write: B|643|app-alarm in:5602555 for vs:15880333

TimerDispatch-704   (  643) [001] … 1308823.804024: tracing_mark_write: E|643

文本形式打开 trace.html,在其底部是填充的 trace 数据 ,如上所示数据片段,带有 tracing_mark_write 标签的即包含 atrace 数据。在 trace.html 文件中有关于 trace 格式介绍,如下数据片段。

# tracer: nop

# entries-in-buffer/entries-written: 178063/178063   #P:8

#                                      _-----=> irqs-off

#                                     / _----=> need-resched

#                                    | / _—=> hardirq/softirq

#                                    || / _–=> preempt-depth

#                                    ||| /     delay

#           TASK-PID    TGID   CPU#  ||||    TIMESTAMP  FUNCTION

#              | |        |      |   ||||       |         |

-0     (-----) [003] d.s2 1308814.493991: sched_waking: comm=rcu_preempt pid=9 prio=120 target_cpu=003

-0     (-----) [000] d.s2 1308814.493997: sched_waking: comm=rcu_sched pid=10 prio=120 target_cpu=000

在 trace.html 中,一条完整的 atrace 数据为:

.sample.android-19452 (19452) [005] … 1308823.801863: tracing_mark_write: B|19452|activityStart

.sample.android-19452 (19452) [005] … 1308824.801753: tracing_mark_write: E|19452

在上文介绍 Systrace 时候,我们提到,Trace#beginSection(String)Trace.endSection() 最终是调用如下宏。

#define WRITE_MSG(format_begin, format_end, name, value) { \

write(atrace_marker_fd, buf, len); \

}

其中,write 函数传入的 trace 数据为:

B|19452|activityStart

E|19452

B 表示 Section 进入,E 表示 Section 退出,从以上数据片段可以看出,相较于 trace.html 中 atrace 数据少了很多信息,缺少的信息是内核补全。

Systrace 工具中 --from-file 是可以将原始 atrace 数据转化为可视化的 html 文件。因此,针对 atrace 数据我们需要补全缺少的信息。结合前面介绍的 trace 格式说明及多次验证,可被 Systrace 工具识别的 atrace 文件格式满足如下:

- [001] …1 : trace_mark_write:<B|E>||

格式说明:

  1. <ThreadName>:线程名,若为主线程,可指定为包名。

  2. <ThreadID>:线程 ID。

  3. <Time seconds>:方法开始或者结束时间戳。

  4. <B|E>:标记该条记录为方法开始(B)还是结束(E)。

  5. <ProcessID>:所在进程 ID。

  6. <TAG>:方法标记,字符长度不可超过 127。

[001]...1 对应的数据用户层是无法获取,因此硬编码写死。

RheaTrace 格式

Systrace 中相关 atrace 数据格式有很多冗余信息,冗余信息是可以通过脚本来进行补充,这样在 atrace 存储过程中可以减少一定数据量的存储。

仅采集主线程 atrace 数据,其对应格式如下:

1306401.857369: B|16667|VerifyClass com.bytedance.rheatrace.atrace.TraceEnableTagsHelper

1306401.857498: E|16667

1306401.857560: B|16667|VerifyClass com.bytedance.rheatrace.common.ReflectUtil

1306401.857825: E|16667

1306401.857876: B|16667|VerifyClass kotlin.jvm.internal.Intrinsics

1306401.858241: E|16667

1306401.858523: B|16667|VerifyClass com.bytedance.rheatrace.core.RheaNoticeManager

1306401.858633: E|16667

因为 RheaTrace 仅支持采集主进程 trace 数据,因此,进程 ID 信息无需写入,另外主线程名为包名也无需写入,主线程 ID 与进程 ID 一致也无需写入,剩余信息均为格式模板信息也无需写入,唯一需要记录的是时间戳。

采集所有线程 atrace 数据,其对应格式如下。

1306401.859162 16667: B|16667|RheaApplication#onCreate

1306401.859173 16667: E|16667

1306401.859756 16667: E|16667

1306401.859877 16667: B|16667|activityStart

1306401.862738 16680: B|16667|JIT compiling int sun.util.locale.StringTokenIterator.nextDelimiter(int) (baseline=0, osr=0)

1306401.862772 16680: B|16667|Compiling

1306401.863154 16680: B|16667|ScopedCodeCacheWrite

1306401.863172 16680: B|16667|mprotect all

1306401.863207 16680: E|16667

当采集多线程数据时,我们需要获取对应的线程 ID,线程名我们没有通过在 App 期间获取,而是读取 Systrace 工具生成 trace.html 中读取。如下数据片段,我们可以获取进程 ID 为 16667 对应的所有线程 ID 及名称。当然也会存在线程 ID 如下数据片段找不到的情况,我们暂时用 <...>代替。

USER            PID   TID CMD

root              1     1 init

root              1   548 init

root              2     2 kthreadd

root              3     3 rcu_gp

root              5     5 kworker/0:0H

root              7     7 mm_percpu_wq

root              8     8 ksoftirqd/0

root              9     9 rcu_preempt

root             10    10 rcu_sched

root             11    11 rcu_bh

u0_a168       16667 16684 FinalizerWatchd

u0_a168       16667 16685 Binder:16667_1

u0_a168       16667 16686 Binder:16667_2

u0_a168       16667 16687 Binder:16667_3

u0_a168       16667 16688 Profile Saver

u0_a168       16667 16689 async-writer

u0_a168       16667 16690 RenderThread

u0_a168       16667 16693 HWC release

u0_a168       16667 16694 GPU completion

通过 RheaTrace 提供的脚本,我们就可以将原始 atrace 数据加工为标准 atrace 格式,如下数据片段。

.sample.android-16667 [001] …1 1306401.857369: tracing_mark_write: B|16667|VerifyClass com.bytedance.rheatrace.atrace.TraceEnableTagsHelper

.sample.android-16667 [001] …1 1306401.857498: tracing_mark_write: E|16667

.sample.android-16667 [001] …1 1306401.857560: tracing_mark_write: B|16667|VerifyClass com.bytedance.rheatrace.common.ReflectUtil

.sample.android-16667 [001] …1 1306401.857825: tracing_mark_write: E|16667

.sample.android-16667 [001] …1 1306401.857876: tracing_mark_write: B|16667|VerifyClass kotlin.jvm.internal.Intrinsics

.sample.android-16667 [001] …1 1306401.858241: tracing_mark_write: E|16667

.sample.android-16667 [001] …1 1306401.858523: tracing_mark_write: B|16667|VerifyClass com.bytedance.rheatrace.core.RheaNoticeManager

.sample.android-16667 [001] …1 1306401.858633: tracing_mark_write: E|16667

当通过 Systrace 命令获取 trace.html 后,trace.html 中的 atrace 因为被 RheaTrace 拦截写入自定义文件中,因此生成的 trace.html 文件中是不包含 atrace 数据。

如果不包含 atrace,那么 trace.html 的作用将非常小,因此,我们需要将 atrace 数据填充进入 trace.html 中,经过验证 atrace 数据满足如下格式,能够被 trace.html 识别。

- (ProcessID) [001] …1 : trace_mark_write:<B|E>||

相较于标准 atrace 文件,它多了 (ProcessID)数据。

有了上述介绍,我们介绍下 RheaTrace 生成的 systrace.html 中间会生成哪些文件。

python rheatrace.py -a rhea.sample.android -t 3 -o ./output/systrace.html

在 systrace.html 同级目录下会生成 .build 目录,其中包括上述中间产物文件。

├── .build

│   ├── atrace-standard          //标准 atrace 格式,可直接用 perfetto 打开。

│   ├── rhea-atrace              //从设备中拉取的 rhea-atrace.gz 文件解压得到,原始 RheaTrace 格式的 atrace 数据。

│   ├── systrace-fs-origin.html  //如果设备 root,其中会包括内核 IO 事件,前文有提到。

│   └── systrace-origin.html     //通过 Systrace 工具抓取的可视化 trace 文件,不包含 atrace 数据。

└── systrace.html                //atrace-standard 与 systrace-fs-origin.html 或 systrace-origin.html 合并得到。

未来规划

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则近万的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)

总结

现在新技术层出不穷,如果每次出新的技术,我们都深入的研究的话,很容易分散精力。新的技术可能很久之后我们才会在工作中用得上,当学的新技术无法学以致用,很容易被我们遗忘,到最后真的需要使用的时候,又要从头来过(虽然上手会更快)。

我觉得身为技术人,针对新技术应该是持拥抱态度的,入了这一行你就应该知道这是一个活到老学到老的行业,所以面对新技术,不要抵触,拥抱变化就好了。

Flutter 明显是一种全新的技术,而对于这个新技术在发布之初,花一个月的时间学习它,成本确实过高。但是周末花一天时间体验一下它的开发流程,了解一下它的优缺点、能干什么或者不能干什么。这个时间,并不是我们不能接受的。

如果有时间,其实通读一遍 Flutter 的文档,是最全面的一次对 Flutter 的了解过程。但是如果我们只有 8 小时的时间,我希望能关注一些最值得关注的点。

(跨平台开发(Flutter)、java基础与原理,自定义view、NDK、架构设计、性能优化、完整商业项目开发等)

《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》,点击传送门即可获取!

大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!**

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)

总结

现在新技术层出不穷,如果每次出新的技术,我们都深入的研究的话,很容易分散精力。新的技术可能很久之后我们才会在工作中用得上,当学的新技术无法学以致用,很容易被我们遗忘,到最后真的需要使用的时候,又要从头来过(虽然上手会更快)。

我觉得身为技术人,针对新技术应该是持拥抱态度的,入了这一行你就应该知道这是一个活到老学到老的行业,所以面对新技术,不要抵触,拥抱变化就好了。

Flutter 明显是一种全新的技术,而对于这个新技术在发布之初,花一个月的时间学习它,成本确实过高。但是周末花一天时间体验一下它的开发流程,了解一下它的优缺点、能干什么或者不能干什么。这个时间,并不是我们不能接受的。

如果有时间,其实通读一遍 Flutter 的文档,是最全面的一次对 Flutter 的了解过程。但是如果我们只有 8 小时的时间,我希望能关注一些最值得关注的点。

(跨平台开发(Flutter)、java基础与原理,自定义view、NDK、架构设计、性能优化、完整商业项目开发等)

[外链图片转存中…(img-6PFPTywb-1711812800632)]

《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》,点击传送门即可获取!
  • 28
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值