延迟渲染：先打草稿后上色，多灯光场景效率高

你一身傲骨怎能输

于 2025-05-17 00:02:22 发布

阅读量433

点赞数 12

分类专栏：计算机图形学文章标签：延迟渲染

本文链接：https://blog.csdn.net/qq_33060405/article/details/148019459

版权

计算机图形学专栏收录该内容

128 篇文章

订阅专栏

摘要

延迟渲染是一种高效的图形渲染技术，特别适用于多灯光和复杂特效的场景。其核心思想是“先打草稿，后上色”，即先将场景中每个像素的基本信息（如位置、法线、颜色等）存储在G-Buffer中，再统一计算灯光效果。这种方法避免了传统前向渲染中每画一个像素都要重复计算所有灯光的低效问题，显著提升了多灯光场景的渲染效率。
延迟渲染的优点包括：多灯光场景下效率高、后期特效实现灵活。然而，它也存在一些缺点，如显存占用大、透明物体处理复杂、某些特效实现难度较高等。为了优化延迟渲染，开发者通常采用G-Buffer压缩、灯光分区、早期Z剔除等技术，以减少显存占用和计算开销。对于透明物体，常见的解决方案是混合渲染，即用延迟渲染处理不透明物体，用前向渲染单独处理透明物体。
在现代游戏引擎中，延迟渲染已成为3A大作的标配，尤其适合需要大量灯光和特效的场景。尽管在移动端存在显存和算力限制，但通过简化G-Buffer、降低精度、混合渲染等优化手段，延迟渲染也能在移动设备上实现复杂的光影效果。

1. 传统渲染（前向渲染）——“边画边上色”

想象你在画一幅画，每画一个小格子（像素），你都要立刻决定它的最终颜色：

这个格子受哪些灯光照亮？
有没有阴影？
反射、透明、特效怎么处理？

如果有很多盏灯，每画一个格子都要把所有灯光都算一遍，画面越复杂，画得越慢，效率很低。

比喻：
就像你画画时，每画一笔都要把所有光影、特效一次性全算完，画得很累。

2. 延迟渲染——“先打草稿，后统一上色”

延迟渲染的思路是：
先把所有物体的基本信息记下来，最后再统一上色！

2.1 第一步：打草稿（G-Buffer）

先把场景里每个像素的“草稿信息”都记下来，比如：
- 位置（这个像素在3D空间的坐标）
- 法线（表面朝向）
- 颜色（材质本色）
- 其他（比如反射率、粗糙度等）

这些信息被存到一组叫G-Buffer的“信息表”里。

比喻：
就像你先把画布上每个格子的轮廓、颜色、朝向都记在小本子上，还没上色。

2.2 第二步：统一上色（Lighting Pass）

拿着这本“信息小本”，再来一遍，把所有灯光效果一次性算出来。
这时你只需要对屏幕上的每个像素做一次灯光计算，不用重复画物体。

比喻：
等所有草稿都画好后，你再根据小本子，统一给每个格子上色、加光影，效率高多了！

3. 延迟渲染的优点——“多灯光不怕累”

多灯光效率高：
不管有多少盏灯，灯光计算只和屏幕像素数量有关，不和场景复杂度有关。
特效灵活：
可以很方便地加各种后期特效，比如泛光、景深、屏幕空间反射等。

比喻：
以前是每画一笔都要算所有灯光，现在是先画好草稿，最后再统一加灯光，省时省力！

4. 延迟渲染的缺点——“信息本子太厚”

显存占用大：
G-Buffer要存很多信息，显存用得多。
透明物体难处理：
因为草稿只能记一层，透明的东西不好分层。
某些特效实现复杂：
比如多重反射、体积光等，需要特殊处理。

比喻：
小本子太厚，记得太多，容易装不下；有些特殊的画法（比如玻璃、烟雾）不太好记。

5. 生活小剧场

小明：为什么延迟渲染适合多灯光的场景？

技术大佬：

因为你只需要在最后统一给每个像素加灯光，不用每画一个物体都算一遍，省时省力！

小美：那透明的玻璃怎么画？

技术大佬：

透明物体需要单独处理，不能直接用延迟渲染的小本子记下来。

6. 总结口诀

延迟渲染是什么？
先打草稿，后上色，灯光多了也不怕。
优点：多灯光效率高，后期特效加得妙。
缺点：显存吃得多，透明物体难搞定。

我们继续用生动形象的方式，深入介绍延迟渲染的实现细节、与前向渲染的对比、G-Buffer的内容、以及现代游戏引擎中的应用。

1. 延迟渲染的实现细节——“分步流水线，环环相扣”

1.1 第一步：填G-Buffer（打草稿）

每个像素都记下重要信息，比如：
- 位置（Position）：像素在3D空间的坐标
- 法线（Normal）：表面朝向
- 漫反射颜色（Diffuse Color）：本来的颜色
- 镜面反射（Specular）：高光信息
- 其他（如材质参数、深度等）

这些信息被分别存到几张“信息表”（G-Buffer的多张贴图）里。

比喻：
就像你画画时，先在不同的本子上分别记下每个格子的颜色、朝向、位置等。

1.2 第二步：Lighting Pass（统一上色）

遍历屏幕上的每个像素，根据G-Buffer里的信息和所有灯光，计算最终颜色。
这一步只需要对屏幕上的像素做一次灯光计算，不用管场景里有多少物体。

比喻：
你拿着所有本子，给每个格子统一上色、加光影，效率高！

1.3 第三步：后处理（Post-Processing）

可以很方便地加各种屏幕特效，比如泛光、景深、色调映射等。
因为所有信息都在G-Buffer里，处理起来很灵活。

2. 前向渲染 vs. 延迟渲染——“两种画画方式的大比拼”

对比点	前向渲染（Forward）	延迟渲染（Deferred）
灯光数量	灯光多时效率低	灯光多时效率高
透明物体	处理简单	处理复杂
显存占用	占用较少	占用较多
特效灵活性	屏幕特效实现较难	屏幕特效实现方便
适用场景	少灯光、透明多的场景	多灯光、特效多的场景

比喻：
前向渲染像是“边画边上色”，适合小画、细活；
延迟渲染像是“先打草稿后上色”，适合大场面、灯光多的画。

3. G-Buffer都存什么？——“信息小本子大揭秘”

G-Buffer其实是几张不同的贴图，每张都记着不同的信息：

位置贴图（Position Map）：每个像素的3D坐标
法线贴图（Normal Map）：每个像素的表面朝向
颜色贴图（Albedo/Diffuse Map）：本来的颜色
高光贴图（Specular Map）：高光强度和粗糙度
深度贴图（Depth Map）：像素距离摄像机的远近

比喻：
就像你有一本“颜色本”、一本“朝向本”、一本“位置本”，每本都记着不同的信息，最后一起用来上色。

4. 现代游戏引擎中的延迟渲染——“大作标配，特效神器”

Unity、Unreal等主流引擎都支持延迟渲染，尤其适合3A大作、需要大量灯光和特效的场景。
许多现代游戏（如《战地》、《使命召唤》、《地铁：离去》等）都用延迟渲染来实现复杂的光影和特效。
有些引擎还会混合使用前向和延迟渲染，比如主场景用延迟渲染，透明物体用前向渲染。

比喻：
延迟渲染就像是现代大工厂的流水线，能高效地批量生产精美画面。

5. 生活小剧场升级版

小明：G-Buffer为什么要分这么多本子？

技术大佬：

因为每种信息都很重要，只有把位置、朝向、颜色、高光都记下来，才能最后统一上色，画出真实的光影效果！

小美：为什么有些游戏还是用前向渲染？

技术大佬：

如果场景里灯光不多，或者有很多透明物体，前向渲染更简单省资源。

小刚：延迟渲染能做哪些酷炫特效？

技术大佬：

泛光、景深、屏幕空间反射、环境光遮蔽、体积雾……只要你想得到的屏幕特效，延迟渲染都能轻松实现！

6. 总结口诀升级版

延迟渲染分两步，先记信息后上色。
多灯光场景效率高，特效丰富画面妙。
G-Buffer本子多，显存吃得多。
透明物体难处理，前向渲染来补齐。

我们继续用生动形象的方式，深入聊聊延迟渲染的优化技巧、透明物体的处理、G-Buffer的压缩方法，以及移动端的延迟渲染。

1. 延迟渲染的优化技巧——“让大工厂更高效”

1.1 G-Buffer压缩——“小本子瘦身计划”

问题：G-Buffer要存很多信息，显存压力大，数据传输也慢。
优化方法：
- 减少精度：比如用16位浮点代替32位，或者用8位整数存颜色。
- 合并信息：把多个信息打包进一张贴图，比如把法线的X、Y分量和高光强度塞进一张贴图的RGB通道。
- 只存需要的信息：有些特效用不到全部信息，可以只存部分数据。

比喻：
就像你把小本子上的内容用缩写、符号、压缩包记下来，既省空间又方便查找。

1.2 灯光分区——“分片包干，灯光不乱算”

问题：虽然延迟渲染对多灯光友好，但如果每个像素都算所有灯光，还是很慢。
优化方法：
- Tiled Deferred Rendering（瓦片延迟渲染）：把屏幕分成小块（瓦片），每块只算影响到它的灯光。
- Clustered Deferred Rendering（簇式延迟渲染）：把屏幕和空间分成三维小块，每块只算相关灯光。

比喻：
就像工厂把画布分成小区，每区只让附近的灯光师傅来上色，效率更高。