[学习记录]浅谈Android硬件加速

最近看了一些Android硬件加速的文章,因此做个记录与总结

众所周知 ,如果使用GPU进行图形绘制,就认为是硬件减速绘制;反之,则是软件绘制。

以平时开发举例,实现一个圆角矩形按钮通常有两种方案:使用PNG图片;使用代码(XML/java)实现。

简单对比下两种方案:

方案原理特点
使用PNG图片(BitmapDrawable)解码PNG图片生成Bitmap,传到底层,由GPU渲染图片解码消耗CPU运算资源,Bitmap占用内存大,绘制慢
使用代码实现(ShapeDrawable)直接将Shape信息传到底层,由GPU渲染消耗CPU资源少,占用内存少,绘制快

页面渲染背景知识

  • 页面渲染时,被绘制的元素最终要转换成矩阵像素点(即多维数组形式,类似安卓中的Bitmap),才能被显示出来

  • 页面由各种基本元素组成,例如圆形,圆角矩形,线段,文字,矢量图,Bitmap等

  • 元素绘制时尤其是动画绘制的过程中,经常涉及插值、缩放、旋转、透明度变化,物理运动,多媒体文件解码等运算

  • 绘制过程经常需要进行逻辑较简单、但数据量庞大的浮点运算。

CPU与GPU结构对比

CPU(Central Processing Unit 中央处理器)是计算机设备核心器件,用于执行程序代码

GPU (Graphics Processing Unit 图形处理器) 主要用于图形计算,通常说的"显卡"的核心部件就是GPU

下面是GPU和CPU的结构对比图。其中

  • 黄色的为Control为控制器,用于协调控制整个CPU的运行,包括取出指令、控制其他模块的运行等

  • 绿色的ALU(Arithmetic Logic Unit)是算术逻辑单元,用于进行数学、逻辑运算;

  • 橙色的Cache和DRAM分别为缓存和RAM,用于存储信息

从结构图可以看出,CPU的控制器较为复杂,而ALU数量较少。因此CPU擅长各种复杂的逻辑运算,但不擅长数学尤其是浮点运算。

  • 以8086为例,一百多条汇编指令大部分都是逻辑指令,数学计算相关的主要是16位加减乘除和移位运算,一次整型和逻辑运算一般需要1-3个机器周期,而浮点运算要转换成整数计算,一次运算可能消耗上百个机器周期。

  • 更简单的CPU甚至只有加法指令,减法用补码加法实现,乘法用累加实现,除法用减法循环实现。

  • 现代CPU一般都带有硬件浮点运算器(FPU),但主要适用于数据量不大的情况。

CPU是串行结构,以计算100个数字为例,对于一个CPU的核,每次只能计算两个数的和,结果逐步累加。

和CPU不同的是,GPU就是为实现大量数学运算设计的。从结构图可以看到,GPU的控制器比较简单,但包含了大量ALU。GPU中的ALU使用了并行设计,且具有较多的浮点运算单元。

至此,我们可以说出硬件加速的主要原理,即通过底层软件代码,将CPU不擅长的图形计算转换成GPU专用指令,由GPU完成。

纯软件绘制VS硬件加速(android 6.0)

下面根据具体的几种场景,具体分析一下硬件加速后的流程与加速效果。

渲染场景纯软件绘制硬件加速加速效果分析
场景1.页面初始化绘制所有View创建所有DisplayListGPU分担了复杂计算任务
场景2.在一个复杂页面调用背景透明TextView的setText(),且调用后其尺寸位置不变重回脏区内所有ViewTextView以及每一集父View冲间DisplayList重叠的兄弟节点不需CPU重绘,GPU会自行处理
场景3.TextView逐帧播放Alpha/Translation/Scale动画每帧都要重绘脏区内所有View除第一帧同场景2,之后每一帧只更新TextView对应的RenderNode的属性刷新一帧性能极大提高,动画流畅度提高
场景4.修改TextView透明度重回脏区内所有View直接调用RenderNode.setAlpha()更新加速前需全页面遍历,并重绘很多View;加速后只触发DecorView.updateDisplayListlfDirty,不再往下遍历,CPU执行时间可以忽略不计

场景1中,无论是否加速,遍历View树并都会走Draw路径。硬件加速后Draw路径不做实际绘制工作,只是构建DisplayList,复杂的绘制计算任务被GPU分担,已经有了较大的加速效果。

场景2中,TextView设置前后尺寸位置不变,不会触发重新绘制Layout。

场景3中,软件绘制每一帧都要做大量绘制工作,很容易导致动画卡顿。硬件加速后,动画过程直接走DisplayList路径更新DisplayList属性,动画流畅度能得到极大提高。

场景4中,两者性能差距更明显。简单修改透明度,软件绘制仍要做很多工作;硬件加速后一般直接更新RenderNode的属性,不需要除法invalidate,也不会遍历View树(除了少数View可能要对Alpha做特殊相应并在onSetAlpha()返回true。

总结

  • CPU更擅长复杂逻辑控制,而GPU得益于大量ALU和并行结构设计,更擅长数学运算。

  • 页面由各种基础元素(DisplayList)构成,渲染时需进行大量浮点运算。

  • 硬件加速条件下,CPU用于控制复杂绘制逻辑、构建或更新DisplayList,进一步提高渲染效率。

  • 在能实现同样效果前提下,应尽量使用更简单的DisplayList,从而达到更好的性能(Shape代替Bitmap等)。

  • 21
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值