对于场景物件的优化,常用到的手段有静态批处理、动态批处理,以及GPU Instancing,关于动静态批处理的限制可以看这里Unity里的静态批处理和动态批处理,今天我们在实测中感受一下它们的区别,重点观察Batches和Meshes两个参数:
- Static Batching:
静态批处理是用空间换时间的做法,由于大量的物件合并,DC确实减少很多,但同时也可以看到Meshes内存占用从77.8M到137.9M。
- Dynamic Batching:
上万数量级别的物件用动态批处理显然是扛不住的,动态批处理通过将所有物体的顶点转换为CPU上的世界空间来工作,所以它只能在渲染Draw Call的工作量小于CPU顶点转换工作量的时候,才会起到提高性能的作用。
- GPU Instancing:
GPU Instancing在减少DC的同时,也避免了内存的爆炸,对于成千上万的物体用GPU Instancing再好不过了。由于constant buffer的限制(默认是500),DC数量也会缓慢增加,2018版本已经支持GI,不用再手写了。
至于使用方法,可以看这里Unity - Manual: GPU instancing和这里利用GPU实现大规模动画角色的渲染
可以看出,当物体顶点数量级别较大,重复度较低时,选择静态批处理;当物体顶点数较少且数量较少时,可以按需求选择动态批处理,当超过一定级别数时(参考:20个顶点的物体,数量超过3000)选择GPU Instancing将更有优势,且数量越多,优势越明显。