Unity Shader - shader lab 的 SRP Batcher compatible 兼容性(未使用 RenderDoc 验证 API)

最新推荐文章于 2024-01-04 17:53:40 发布

Jave.Lin

最新推荐文章于 2024-01-04 17:53:40 发布

阅读量1.6k

点赞数 1

本文链接：https://blog.csdn.net/linjf520/article/details/120785425

版权

unity 同时被 2 个专栏收录

249 篇文章 64 订阅

订阅专栏

unity-shader

141 篇文章 33 订阅

订阅专栏

文章目录

Inspector 中的 SRP Batcher : compatible or not
SRP Batcher 的合批原理
- 怎么 Quickly Update
- Shader 变体数量尽可能少
总结
References

Inspector 中的 SRP Batcher : compatible or not

Built-in RP 下，shader 的 Inspector 视图中是不会显示此项内容的

必须是在基于 SRP 的才会显示
在这里插入图片描述

如何将当前项目设置为 SRP 呢：
Editor/Project Settings/Graphics/Scriptable Render Pipeline Settings 设置为你创建的、继承自 RenderPipelineAsset 的资源（这是 ScriptableObject 资源）

可以是 HDRP，UDP（这两者都是基于 SRP 的预定制版本），或是你自己实现的 SRP吗，如下图：

在这里插入图片描述

这样 Shader Inspector 中才会显示：SRP Batcher : Compatible 与否

有篇文章讲的很详细，其中有讲到 SRP Batcher 兼容性问题：SRP Batcher: Speed up your rendering!

SRP Batcher 的合批原理

SRP Batcher 合拼并不是减少 DC(DrawCall)，而是为了减少 SetPassCall，因为 SetPassCall 多了的话很耗费 CPU 时间。什么是 SetPassCall，可以参考我之前的一篇：Unity - DrawCall, Batch, SetPassCall区别

因为我们在绘制前，以 OpenGL 为例，就是在调用 OpenGL glDrawXXX 的 API 前，需要设置的一大堆数据 glUniformXXX 之类的 API，这些调用材质耗费 CPU 的祸首，因为 glDrawXXX 通常也就几个字节的耗费，相比 SetPassCall 的数据量来说就少非常多了

为了减少 SetPassCall 的数量，用上了 cbuffer 之类的 buffer 机制，将数据一直保存在 GPU 内存中

所以我们在自定义 Shader 的 Properties 中定义的数据一般都放在 UnityPerMaterial 的 cbuffer 中

一些 Unity_ObjectToWorld 每个绘制对象独立的数据，都放在 UnityPerDraw，在 URP 中的 #include "Packages/com.unity.render-pipeline.universal/ShaderLibrary/UnityInput.hlsl 中可以看到有定义：UnityPerDraw 和一些 Global 的 Cbuffer

而且当有修改的时候才重新上传这部分数据（后续有空我会使用 RenderDoc + Unity 来验证），而一些静止不动的对象对应的 CBUFFER 都没有修改，就压根不会去 update + upload，这可以省下非常多的 SetPassCall，尤其是一些大场景更加

而 Unity 文档中都会写着类似的描述，我用 Cnglish 来表达：When Buffer Data Change, we will quickly update the buffer and upload.

所以 SRP Batcher 的条件就是将 Properties 中对应的 uniform 划分到对应的 CBuffer 块即可，怎么划分上面有讲，这里再次强调：逐对象放：UnityPerDraw；主材质放：UnityPerMaterial；帧全局放：一般不用放可以不用放

这些 UnityPerDraw、UnityPerMaterial 的 cbuffer 块(DX) 或时 ubo(uniform block object) (OpenGL) ，都有对那个的格式定义

unity 跨平台会为我们转移 shaderlab 的定义

而 OpenGL 中这些 ubo 的内容，具体可以参考：

怎么 Quickly Update

那么如何个 quickly 法？我猜就是一个 parrallex job （并行）线程来处理

将每个 PerDraw 的CBuffer 使用索引来定位每个绘制对象的数据，这样再 parrallex job 中并行更新数据就使用索引获取、设置即可，即可避免多线程竞态的消耗问题

PerFrame 也就是我们的每帧绘制时的全局数据，也是当有改变的时候才上传，而且这部分内容就全局仅有一份，设置起来也不用多线程，直接 update, upload 即可

要充分发挥 SRP Batcher，那么场景中应用的 shader 变体数据尽量的少，因为 shader 不同，以为着 cbuffer 就有可能不同，那么是不能通过减少 cbuffer 更新的方式来优化的

Shader 变体数量尽可能少

所以 unity 也是建议我们写一个 Uber Shader，何为 Uber ，就是超级 shader 的意思，其中包含很多的功能，基于涵盖场景中大部分绘制对应即可，那么 SRP Batcher 发挥的作用就越大

总结

说到合批一般都有：

Static Batching - 减少 Set Buffer 的 Batching，但是耗内存
Dynamic Batching - 减少 DC，但是耗 CPU
Instancing Batching - 减少 DC
还有就是现在这个 SRP Batcher - 不是减少DC
- 理论上不是 DC 的 Batching，而是减少 Set Buffer 的 Batching
还有 GPU Driven Render Pipeline 简称（GPUDRP ）中的 OneFrameOnDraw Batching（一帧一DC）- 减少DC，且减少 Set Buffer Batching
- GPU Driven 这个肯定是以后的发展方向，所有的 Culling(HiZ), StateChange（应该是 State Select），DrawCall 都是一帧完成，都在 GPU 完成，而 Driven 前，只需要 CPU 上传数据即可，如：所有材质的 BUFFER，给每个材质对应一个索引，还有大量的 CBUFFER 配置，这样就可以通过区别 index 来并行处理所有数据了
合批有一个总结得还不错的文章：Unity 静态批处理/动态批处理/GPU Instancing /SRP Batcher的详细剖析（Unity优化）

References

SRP Batcher: Speed up your rendering!

Jave.Lin

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Unity Shader - shader lab 的 SRP Batcher compatible 兼容性(未使用 RenderDoc 验证 API)

文章目录Inspector 中的 SRP Batcher : compatible or notSRP Batcher 的合批原理怎么 Quickly UpdateShader 变体数量尽可能少总结ReferencesInspector 中的 SRP Batcher : compatible or notBuilt-in RP 下，shader 的 Inspector 视图中是不会显示此项内容的必须是在基于 SRP 的才会显示如果将当前项目设置为 SRP 呢：Editor/Project Se
复制链接

扫一扫