图形学基础 | Deferred Shading（延迟渲染）

最新推荐文章于 2024-05-09 20:55:17 发布

桑来93

最新推荐文章于 2024-05-09 20:55:17 发布

阅读量1.5k

点赞数

分类专栏： [图形学基础]

56 篇文章 129 订阅

订阅专栏

延迟渲染

在计算机图形学中 shading 表示对受光物体的渲染. 主要有几个步骤:

一般渲染引擎，渲染场景中的物体的时候，是将这四步一次执行完的。

延迟渲染则将 前两步和 后两步 分开到渲染管道相互独立的两个部分来执行。

前向渲染有多种问题[1]:

我们无法控制同屏可见的玩家数量、无法控制同屏会有多少特效和光源
由于 传统前向渲染缺乏对环境的控制，且对于光源的复杂度难于估量
所以选择 延迟渲染
这可以让我们的画面更接近于当今顶尖的游戏引擎，并且 让光照所耗费的资源独立于场景的几何复杂度

延迟渲染需要显卡提供MRT的支持

延迟渲染的好处:

目前我们看到最终画面都是2D的，只能看到有限的像素数，理论上我们只要处理(指光照，阴影处理)最终我们可以看到的点的效果就够了，多余的处理是浪费的。
延迟渲染: 它先将摄像机空间的点光栅化转化成屏幕坐标后再进行处理。这样就能减少处理的次数，从而提高效率。
把处理流程放在了后面，那么处理所需要的参数也必须带到后面的流程. 使用MRT(multi target render)就很重要，RT占用的显存越大，对显卡的的带宽要求也就越高. 后面的处理至少需要空间位置信息，可以通过Depth(至少16位) 获得，其他可以将 法线信息(normal)，高光信息(specular)，AO系数，diffuse，自发光(emissive)，材质编号等信息放入MRT中 。

延迟渲染可化为为四个阶段:

Geometry : 将本帧所有的 几何信息 光栅化到G-buffer。包括位置，法线，贴图等。
Lighting : 以G-buffer作为输入（位置，法线）进行 逐像素的光照计算 将 diffuse lighting和specular lighting 结果分别保存在两张RT上作为lighting buffer.
Composition : 将G-buffer中的 贴图buffer 和 lighting buffer 融合，得到渲染结果。
Post-processing : 后处理如HDR SSAO Blur Bloom等.

使用延迟渲染技术最大的好处就是可以渲染光照极为复杂的场景。
这里场景中的 光照可以分为两类 :

影响 整个场景的scenelight。
- 如directionallight。
- 渲染一个 screenquad，逐像素光照计算
另一类是 只影响一部分区域的locallight
- 如点光源、聚光灯、和特效等等。
- 这些locallight只影响到屏幕上的某些像素，当然不需要逐像素的进行光照计算。
- 最简单的方法是 绘制这些光源的包围体 （点光源的包围体是球，聚光灯的包围体是圆锥） ，包围体的大小要大于等于光源的衰减范围。这些包围体经过变换投影到屏幕上的对应区域，随后在pixelshader中计算光照.

优化:

光源包围体的 视锥剔除 ，遮挡剔除。
光源包围体 投影后很小时剔除；若干个靠的比较近的小光源合并成一个较大的光源
光源包围体的 backfaceculling 背面剔除
屏幕空间中没有被光源照到的，或者被更近的物体遮挡住的像素不需要光照计算，因此可以逐像素的深度剔除
- a. 使用正确的stencillightvolume
- b.使用ztest，可以得到“一定程度上正确”的结果

解决方案:

增强了MRT的性能. DX10和SM4都提供了GPU支持的整数处理，以及从深度缓冲中读取数据。所有这些都可以减少显存带宽。当提供了新的硬件和特性时，性能自然就会提升。
在合适的Filter作用下，精确的边缘检测可以减少几何体边缘的锯齿。
对不透明物体采用延迟渲染，透明物体采用正向渲染，可以解决Alpha Blend的问题

关注

专栏目录