一、减少需要处理片元数目
这部分的优化策略是减少overdraw,overdraw就是一个像素被绘制多次。
- 控制绘制顺序
由于深度测试的存在,如果我们可以保证物体都是从前往后绘制,那么就可以很大程度上减少overdraw,这是因为后面绘制的物体没办法通过深度测试,因此就不会进行后面的渲染处理。渲染队列小于2500(Background、Geometry、AlphaTest)的对象都被认为是不透明物体,这些物体都是从前往后绘制的,而使用的其他队列(Transparent、Overlay)这些都是从后往前绘制的,也就是说我们需要尽量把物体设置为不透明的渲染队列,尽量避免使用半透明队列。所以对于一些确定的情况,我们也可以使用自定的渲染顺序,这样对于很多物体就可以在很多后面渲染,节省片元绘制使用。 - 警惕透明物体
对于半透明物体来说,由于没有开启深度写入,它们只能从后往前进行渲染,所以半透明物体一定会造成overdraw,包括GUI中的截面,等等,应尽可能避免很多半透明的进行重叠。 - 减少实时光照和阴影
过多的点光源,或者是使用了多个Pass的Shader,都会造成性能下降。
很多游戏场景中,移动平台的画面好像有很多点光源,其实是使用了烘焙技术,将光照提前烘焙到一张纹理中,然后就按照纹理采样结果可以得到光照结果,还有就是God Ray可以模拟很多小型光源。
二、节省带宽
- 减少纹理大小
纹理尽可能要正方形,长宽最好是2的整数幂,这个时候才可以把优化发挥到最好的作用,
多级渐远纹理技术(具体解释)
纹理压缩同样可以节省带宽,即各种压缩格式。 - 使用分辨率缩放
我们可以对一些低端设备(分辨率高其他硬件不行的)我们可以降低分辨率进行缩放,降低分辨率可以直接使用Screen.SetResolution
。
三、减少计算复杂度
- Shader的LOD技术,这个技术可以控制Shader的LOD等级,只有Shader的LOD值小于某个设定的值时,这个Shader才会被使用,超过的话,就不会被渲染。
一般Unity内置的Diffuse的LOD为200、Bumped Specular的LOD为400。
SubShader
{
Tags{"RenderType"="Opaque"}
LOD 200
}
-
代码的优化
代码中 我们需要尽量将计算放在某个对象或者顶点中,就像我们之前把采样坐标计算代码放在顶点着色器中一样。
还有就是我们要尽可能使用低精度的浮点值进行运算,
高精度的float/highp适用于存储诸如顶点坐标变量,但计算速度最慢,我们应该避免在片元着色器中使用这种精度。
half/mediump适用于一些标量、纹理坐标等变量,它的计算速度大约是float的两倍。
fixed/lowp 适用于绝大多数颜色变量和归一化的方向矢量。再进行一些精度要求不高的计算时,我们应该尽量使用这个。它的计算速度是float的4倍,但要避免对低精度变量进行频繁的swizzle操作(如color.xwxw),还要避免在很多精度之间进行转换。还要根据不同平台来决定是否对其进行插值变量等等,比如我们两张纹理坐标存储到float中的xy、zw变量中,部分平台也会造成反作用。
尽可能不能使用全屏的屏幕后处理效果,如果我们实在是需要Bloom、热扰动等等效果,那我们应该使用低精度(fixed)进行运算,那些高精度的运算可以使用查找表(LUT)或者转移到顶点着色器中进行处理,
除此之外还需要尽量将很多特效转移到一个Shader中,
尽可能不使用 分支、循环语句,
尽可能避免使用 sin、tan、pow、log等较为复杂的数学运算,
尽可能不使用 discard 操作,因为会影响部分硬件的优化效果。