渲染流程
- 应用阶段(Application Stage)
- 准备好场景数据,摄像机位置等
- 粗粒度剔除,把不可见的物体剔除出去
- 设置渲染状态,材质,纹理,shader等
最重要的是输出渲染图元(点,线,三角面等),给几何阶段
- 几何阶段(Geometry Stage)
把顶点坐标变换到屏幕空间中,输出屏幕空间的二维顶点坐标、每个顶点对应的深度值、着色等 - 光栅化阶段(Rasterizer Stage)
决定每个渲染图元中的哪些元素应该被绘制在屏幕上,对上一阶段得到的逐顶点数据进行插值,然后再进行像素处理。
CPU和GPU之间的通信
有时希望CPU可以访问网格数据来进行碰撞检测,所以RAM中的这部分数据就不需要移除
渲染状态
使用哪个顶点着色器(Vertex Shader)/片元着色器(Fragment Shader)、光源属性、材质等,给场景中的网格进行渲染。
GPU流水线
通过流水线操作,把图元渲染到屏幕上。
- 顶点着色器(Vertex Shader):空间变换,顶点着色
特点:未知顶点关系,无法得知两个顶点是否属于同一个三角网络。
坐标变换:通过改变位置来模拟水面、布料等。把顶点坐标哦那个模拟空间转换到齐次裁剪空间,在由硬件透视除法得到归一化的设备坐标(Normalized Device Coordinates, NDC)下的坐标
OpenGL下NDC的z分量范围[-1,1],而在DirectX中,[0,1]
常见输出为交由光栅化阶段的片元着色器。 - 曲面细分着色器(Tessellation Shader):细分图元(可选着色器)
- 几何着色器(Geometry Shader):逐图元着色(可选着色器)
- 裁剪(Clipping):将不在摄像机视野内的顶点裁剪掉
- 屏幕映射(Screen Mapping):每个图元坐标转换到屏幕坐标系中(不可配置和编程的)
把每个图元的x和y坐标转换到屏幕坐标系(Screen Coordinates),在OpenGL中左下为最小窗口值,在DirectX中左上为最小窗口值。 - 三角形设置(Triangle Setup):上一步得到的是顶点信息,这一步计算边上每个点。
- 三角形遍历(Triangle Traversal):检查每个像素是否被一个三角形网格所覆盖。
- 片元着色器(Fragment Shader):逐片元着色
通过对上一个步骤得到的纹理插值进行计算,得出片元的颜色。
- 逐片元操作
决定每个片元的可见性,之后再把通过测试的片元的颜色值和颜色缓冲区的颜色合并。- 模板测试:用于限制渲染的区域。
- 深度测试:与模板测试不同,如果没有通过深度测试,那么就没有权利更改深度缓冲区中的值。
- 合并:针对半透明物体,需要混合让物体看起来是透明的。如果没有开启,则直接覆盖掉颜色缓冲区中的颜色;如果开启了,GPU取出源颜色和目标颜色,将两种颜色进行混合。
- 为保证看到的图像是连续的,采用双重缓冲的策略,一旦场景已经被渲染到了后置缓冲中,那么交换前置和后置的内容。
- 模板测试:用于限制渲染的区域。
总结
- 命令缓冲区:CPU向其中添加命令,GPU从中读取命令,从而实现并行工作。
- 批处理:将很多小的Draw Call合并成一个大的Draw Call。(针对静态的物体,将网格合并)
为了减少Draw Call的开销:避免使用大量很小的网格,避免使用过多的材质。