首先,在Gradle 4.6以前,如果项目中使用了注解处理器,那么每次代码修改都要进行全量编译。此外,若是修改的类中,包含有公有静态常量,那么也同样会导致本次修改需要进行全量编译。
Instant Run在使用过程中,有时也会遇到一些兼容性问题,但由于它是集成在Android Studio内部的,对于我们来说是一个黑盒,无法自行定位解决问题,只能被动地反馈问题与等待新版本发布。所以综合来看,这个方案并不合适引入。
在最新的Android Studio中,Instant Run已经被废弃,取而代之的,是Apply Changes方案,它是基于JVMTI技术来实现的。不过仅支持 Android 8.0 或者更高版本的手机,实测在工程中带来的提速效果也不明显。
另一个就是阿里推出的Freeline方案了,它可以充分利用缓存文件,在几秒钟内迅速地对代码的改动进行编译并部署到设备上,提速效果十分明显。不过它同样存在着一些不可忽视的问题。首先是不支持Kotlin,这在Kotlin已经被谷歌官宣为Android开发首选语言的今天,是比较致命的。另外,不支持删除带id的资源,否则可能导致资源编译流程出错。
另外一个潜在的问题是,为了确保编译速度,Freeline是牺牲了一部分正确性的。例如,在改动公有静态常量的时候,只会编译对应的类文件,而引用到该常量的其他类,并不会参与编译的。由于常量内联优化的存在,就可能导致这些类在运行时,使用的仍然是旧的值,进而出现改动不生效的问题。
综合上述,目前业界已有的解决方案,并不能满足我们的需求。所以在2019年初,我们开启了增量编译组件的自研之路。
=========================================================================
在2019年6月份,增量编译组件完成了首版开发,开始正式接入QQ音乐工程。
接入后,对于本地开发的提速效果是比较明显的。据团队实际数据统计,进行一次全量编译的耗时约为418秒,而增量编译单次耗时仅需13秒。以天为单位计算,每个人花在工程编译上的总时长,由3.95小时,降低至了1.02小时,效率提升达到74%。
增量编译组件完全基于Gradle标准,实现为一个Gradle插件,具备良好的多平台兼容性,而且对于目标工程的侵入性极低。使用者只需要接入我们的Gradle插件,即可通过执行特定的Gradle任务,进入增量编译模式。
在功能的支持上,组件支持Java、Kotlin等代码文件以及所有类型资源文件的快速编译。在今年年初,加入了DataBinding的增量支持。而且,为了进一步减少使用成本,我们还在最新版本中提供了配套的Android Studio插件,开发者可以通过可视化的方式,更方便的使用组件功能。
下图描述了组件的整体原理,我们将开发周期分为编译期和运行期。
首次编译(亦可称全量编译),需要完整编译工程,得到原始安装包,耗时与原生的打包任务持平。后续再触发编译,将会进入耗时极短的增量编译模式,组件会负责收集改动过的代码进行编译,得到增量产物,并推送到手机上。
运行期则负责将手机上的增量产物进行动态加载运行。
在本文的后续内容中,将介绍几个重点模块的实现。
======================================================================
(1)获取改动文件并进行编译
首先需要考虑的问题是,如何识别出用户改动了哪些文件?
我们的做法是,在每次编译成功后,收集所有工程文件的最后修改时间,保存为一份文件快照。在下次编译开始时,组件会生成最新的文件快照,与上一次的文件快照进行比对,就可以收集到用户改动过的文件了。
为了能够单独编译这些文件,还需要解决类引用的问题。
在首次完整编译工程时,组件会收集所有生成的class文件,放到缓存目录中。在编译被改动的文件时,会调用原生的javac或者是kotlinc程序,将刚才的缓存目录作为classpath传递进去,就可以解决编译时代码引用的问题了。
(2)进行代码依赖分析
上文中,提供classpath可以使编译阶段成功执行,却无法确保运行期的代码逻辑是正确的。举个例子,某个类修改了某个方法的参数列表,那么除了这个类需要被编译外,依赖这个类的其他类,也是需要重新编译的。否则,就会在运行期,出现NoSuchMethodException。
因此,由于代码之间相互依赖关系的存在,仅仅收集被用户改动的代码来编译,是不够的。还可能需要找出它的子依赖集,纳入编译范围。
沿着这个思路,还需要考虑两个问题:
-
如何得到改动类的变化类型? 修改方法内部实现等类型的改动,是不会影响到其子依赖集的。在确保编译正确的前提下,为了尽可能地减少参与编译的代码数量,我们需要得到被改动类的变化类型,才能够决定是否需要将其子依赖集重新进行编译。
-
如何得到改动类的子依赖集? 这个很好理解,只有计算出某个类的子依赖集,组件才能知道要编译什么。
想获取这两项信息,都需要对类的内部结构进行分析,提取出类名、类的修饰符、成员变量、方法等数据。我们的做法是,引入ASM工具对class文件进行解析,然后将解析出来的信息,保存到自定义的ResolvedClass数据结构中。
接下来的解决方案是这样的:
-
在全量编译期间,组件会同步启动一个独立的进程,对所有的class文件进行遍历分析,得到对应的ResolvedClass信息,并保存在本地文件中。其中,如果发现某个类引用了另一个类,那么就会把当前类的类名,添加到被引用类的子依赖集列表中(resolvedBy字段)。
-
触发增量编译后,组件首先编译改动类,得到新的class文件。然后启动代码依赖分析流程,解析出新的ResolvedClass,将其与全量编译期解析出来的旧ResolvedClass进行比对,就可以得到这个类的改动类型了。
当发现当前类的改动类型在下表中,组件才会获取其子依赖集,启动第二轮编译,得到子依赖集对应的class文件。
通过上面的方式,我们在确保编译正确的前提下,尽可能地减少了需要编译的代码数量。
随后,增量编译期间生成的所有class文件,会被dx工具进一步地编译为Dex文件,然后通过ADB推送到手机上,等待被动态加载。
(1)资源增量
这一块的基本思路,与代码增量是类似的。即先收集被改动的资源,然后进行编译。
原生的资源编译流程主要采用的是aapt,或者是aapt2 。
一开始,我们工程使用的仍然是aapt,基于它去资源增量的难度相对较大。因为aapt工具是不支持单个资源编译的。Freeline通过修改aapt的源码,实现了单个资源的增量功能。不过他们的这部分方案没有开源,并且改动后仍然不支持带ID资源的删除,所以没有考虑在组件中引入。
再来看看aapt2。与aapt最大的不同在于,它是天然支持单个资源编译的。其内部把资源的打包分成了 编译(compile)与链接(link) 两步,在编译阶段,负责将单个或者多个资源编译为二进制文件;链接阶段,则负责合并所有二进制文件再打包。
于是,我们首先升级工程的工具链,引入了aapt2,然后组件也基于此重新设计了资源增量方案。
在工程首次编译结束之后,组件会将所有编译好的资源二进制文件都收集到一个缓存目录中。后续改动资源时,会先调用aapt2的编译功能,将改动的资源编译成为二进制文件。然后将新的二进制文件拷贝到资源缓存目录中,覆盖掉同名文件。
接着,会针对这个目录,采用aapt2的链接功能,打包生成最后的增量资源包,并推送到手机上,等待被动态加载。
通过这样改造后,QQ音乐工程中资源增量编译阶段的耗时,由原来的32秒降低到了12秒,效率得到进一步提升。
(2)资源ID固定
资源编译过程中,有一个文件是需要特别关注的:R.java文件。
为了让开发者能够在代码中引用资源,资源编译器会在编译的过程中,为每一个资源分配索引ID,并以公有静态常量的方式保存在R.java文件中。开发者只需要在代码中通过R.color.text等形式,即可引用到对应的资源。
而编译器编译源代码时,如果发现某处代码引用了常量(同时使用static和final两个关键字来修饰),且该常量为字面值形式的原始数据类型或字符串时,编译器就会将此处的常量引用替换为常量值。
也就是说,代码中类似R.color.text的引用,在class文件中都会被替换成为对应的数字。
资源编译的过程中,资源是按照名称排序后,按序递增分配索引的。如果新增或者删除资源,会导致其后续资源的索引出现错位。
在这种场景下,如果某个类引用到索引变化了的资源,就需要重新参与编译。否则,就会在运行时遇到资源引用错乱的问题。
但是这就会导致大量的类需要在增量过程中参与编译,和我们的初衷是相违背的。
所以,需要将R.java中的ID进行固定。简单来说,就是使得两次编译之间,对于同一个资源,分配到的ID是不变的。其实在热修复场景下,也具有相同的诉求。对于补丁包,是有严格的大小要求的。如果我们要对资源进行热修复,不可能把所有用到该资源的代码都重新编译纳入补丁包中下发,所以也需要进行资源ID固定。
相对应的解决方案也是业界比较通用的。若尝试输出aapt2命令行工具的帮助文档,可以发现有两个参数:
-
–stable-ids: File containing a list of name to ID mapping.
-
–emit-ids : Emit a file at the given path with a list of name to ID mappings, suitable for use with --stable-ids.
因此,我们可以在编译资源的时候,给aapt2注入emit-ids参数,在指定文件中输出资源名称到资源ID之间的映射关系。并在下次启动aapt2时,通过stable-ids传入刚才的映射关系,达到资源ID固定的效果。
(1)代码注入
编译完成后,可以得到若干个增量Dex包,并推送到手机的特定目录下。
那么在运行期,我们需要做的,是干涉原生的类加载流程,使被改动的代码优先被加载,达到改动生效的目的。
先来看看Android原生的类加载流程。
在应用程序启动后,会采用名为PathClassLoader的类加载器,去加载安装包中的Dex文件。需要加载某个类的时候,系统会从前往后依次遍历Dex数组,直到找到对应的类。
基于此,增量组件会在应用启动的时候,将增量Dex文件,通过反射手段插入Dex数组的最前面。后续需要加载某个类的时候,由于系统机制会从前往后遍历,因此会优先从增量的Dex中查找并命中改动后的类。需要说明的是,所有增量的Dex,会按照生成的时间,倒序插入到Dex数组中,如inc_3.dex、inc_2.dex、inc_1.dex,这样就可以确保一个类被多次增量修改后,被加载到的总是其最新实现。
类改动不生效问题的处理
在第一个版本发布后,我们收到同事的反馈,在Android 7.0或者更高版本的系统上,会偶现代码改动不生效的问题。经过分析,可以确保增量的代码是编译成功的,问题是出现在运行时类加载阶段。
这是由于从Android 7.0开始,虚拟机的代码编译策略,发生了变化。
Dex中的指令,首先需要被翻译成为机器码,才能被执行。随着系统版本的更迭,对于 Dex字节码的编译策略,也有着不同的表现。
在5.0以下的系统中,使用的是Dalvik虚拟机。在应用运行时,每当遇到一个新类,JIT编译器就会对这个类进行即时编译,经过编译后的代码,会被优化成相当精简的原生型指令码,这样在下次执行到相同逻辑的时候,速度会更快。不过由于编译工作是在应用运行过程中进行的,且没有缓存,这就使得应用启动速度较慢,运行效率受到影响,而且耗电较多。
因此,在Android 5.0开始,Google采用ART虚拟机来替代了Dalvik虚拟机。和Dalvik最大的区别在于,ART虚拟机采用的是AOT提前编译机制。系统在安装应用的时候,会使用自带的dex2oat工具,把安装包中的所有Dex文件进行一次预编译,生成一个可以在本地机器上运行的oat文件。这样后续应用每次运行时,就不需要执行编译了,应用的启动与运行的效率也得到了极大的提升。但是AOT每次执行的时间太长了,给用户直观感受就是安装极慢。
所以,从Android 7.0开始,采用了Hybrid Mode的ART虚拟机,它同时支持Interpreter、JIT、AOT三种模式。他们的交替使用,可以达到安装时间、内存占用、电池消耗和性能之间最好的平衡。
在应用运行时,虚拟机会先使用Interpreter去解释与执行代码。如果发现热点函数,会启用JIT编译器,并将编译结果存储在本地profile文件中;当Android设备空闲或者是充电时,系统会在后台定期针对profile文件执行AOT编译,得到一份“热代码”;
在下一次应用重启时,系统会将编译好的热代码,一次性地插入到类加载器的缓存ClassTable中。后续类加载的过程中,会先从ClassTable中寻找是否有缓存,有的话则直接返回,跳过后续的类查找流程。
到这里,我们就可以解释,为什么混合编译会引起偶现的增量代码改动不生效问题了。
若要加载增量改动过的A类,会分为两种情况:
-
热代码中不包含A类:这种情况是比较理想的,系统由于在ClassTable中无法命中,就会到增量Dex中查找A类,此时增量代码是可以生效的。
-
热代码中包含A类:系统在类加载过程中,会在ClassTable中优先命中改动前的A类,从而导致增量不生效的问题。
针对这个问题,Tinker的解决方案是,首先复制原生类加载器的Dex数组,去完全新建一个自定义的类加载器。然后把应用进程引用的所有类加载器,都指向自定义的类加载器,负责后续的所有类加载以及补丁代码注入行为。
最后
现在都说互联网寒冬,其实无非就是你上错了车,且穿的少(技能),要是你上对车,自身技术能力够强,公司换掉的代价大,怎么可能会被裁掉,都是淘汰末端的业务Curd而已!现如今市场上初级程序员泛滥,这套教程针对Android开发工程师1-6年的人员、正处于瓶颈期,想要年后突破自己涨薪的,进阶Android中高级、架构师对你更是如鱼得水!
为什么某些人会一直比你优秀,是因为他本身就很优秀还一直在持续努力变得更优秀,而你是不是还在满足于现状内心在窃喜!
Android架构师之路很漫长,一起共勉吧!
《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》,点击传送门,即可获取!