一次drawcall执行的代码逻辑

你一身傲骨怎能输

于 2024-10-03 22:18:10 发布

阅读量292

点赞数 19

文章标签：计算机图形学

本文链接：https://blog.csdn.net/qq_33060405/article/details/142697088

版权

在Unity中，一次Draw Call执行的代码逻辑涉及多个步骤，这些步骤通常在渲染管线的不同阶段完成。以下是一次典型Draw Call的执行流程和涉及的代码逻辑：

1. 准备阶段

1.1 设置渲染状态

材质和着色器：选择要使用的材质和着色器程序。
纹理绑定：将所需的纹理绑定到对应的纹理单元。
渲染目标：设置当前的渲染目标（如帧缓冲区或纹理）。
深度测试和模板测试：启用或禁用深度测试和模板测试，并设置相应的参数。

1.2 提交顶点数据

顶点缓冲区（VBO）：将顶点数据上传到GPU内存。
索引缓冲区（IBO）：如果使用索引绘制，上传索引数据。
顶点属性指针：设置顶点属性指针，告诉GPU如何解析顶点数据。

2. 执行阶段

2.1 发送绘制命令

Draw Call：调用OpenGL/DirectX的绘制函数（如glDrawElements或DrawIndexed），通知GPU开始渲染指定的图元（如三角形）。

2.2 GPU执行渲染

顶点着色器：GPU对每个顶点执行顶点着色器，计算顶点的最终位置和其他属性（如颜色、纹理坐标）。
图元装配：将顶点组装成图元（如三角形）。
光栅化：将图元转换为像素片段。
片段着色器：对每个片段执行片段着色器，计算最终的颜色值。
深度测试和模板测试：对每个片段进行深度测试和模板测试，决定是否丢弃该片段。
混合：将新生成的片段颜色与帧缓冲区中的现有颜色进行混合。

3. 结束阶段

3.1 清理状态

解绑资源：解除之前绑定的纹理和其他资源。
重置渲染状态：恢复之前保存的渲染状态，以便下一次Draw Call使用。

示例代码逻辑

以下是一个简化的伪代码示例，展示了在一次Draw Call中可能涉及的代码逻辑：

// 准备阶段
void PrepareForDrawCall(Material material, Mesh mesh)
{
    // 设置材质和着色器
    Graphics.DrawMesh(mesh, transform.position, transform.rotation, material);

    // 绑定纹理
    foreach (var texture in material.textures)
    {
        Graphics.BindTexture(texture);
    }

    // 设置渲染目标
    Graphics.SetRenderTarget(renderTarget);

    // 启用深度测试
    Graphics.EnableDepthTesting(true);
}

// 执行阶段
void ExecuteDrawCall()
{
    // 发送绘制命令
    Graphics.DrawElements(PrimitiveType.Triangles, mesh.indexCount, DrawElementsType.UnsignedInt, 0);
}

// 结束阶段
void CleanupAfterDrawCall()
{
    // 解绑资源
    foreach (var texture in material.textures)
    {
        Graphics.UnbindTexture(texture);
    }

    // 重置渲染目标
    Graphics.SetRenderTarget(null);

    // 禁用深度测试
    Graphics.EnableDepthTesting(false);
}

注意事项

批处理：为了提高性能，尽量合并多个对象的Draw Call，减少CPU与GPU之间的通信开销。
状态管理：合理管理渲染状态，避免频繁切换，以提高渲染效率。
优化着色器：编写高效的着色器代码，减少计算复杂度，提升渲染速度。

通过理解并优化这些步骤，你可以显著提高Unity应用的渲染性能和视觉效果。

继续深入探讨Unity中一次Draw Call执行的代码逻辑，我们可以进一步细化每个阶段的具体操作和优化策略。

4. 顶点数据处理

4.1 顶点着色器

顶点着色器是GPU上执行的第一个着色器，它负责处理每个顶点的位置和其他属性。顶点着色器的输出将传递给图元装配阶段。

// 顶点着色器示例
#version 300 es
layout(location = 0) in vec3 a_position;
layout(location = 1) in vec2 a_texCoord;

out vec2 v_texCoord;

void main()
{
    gl_Position = vec4(a_position, 1.0);
    v_texCoord = a_texCoord;
}

4.2 图元装配

图元装配阶段将顶点着色器的输出组装成图元（如三角形）。这个阶段还包括视口变换和裁剪操作。

5. 光栅化

光栅化阶段将图元转换为像素片段。每个片段都会被传递给片段着色器进行处理。

6. 片段着色器

片段着色器负责计算每个像素的颜色值。片段着色器的输入包括顶点着色器的输出和其他插值数据。

// 片段着色器示例
#version 300 es
precision mediump float;

in vec2 v_texCoord;
out vec4 fragColor;

uniform sampler2D u_texture;

void main()
{
    fragColor = texture(u_texture, v_texCoord);
}

7. 深度测试和模板测试

深度测试和模板测试用于确定片段是否可见。深度测试比较片段的深度值与帧缓冲区中的深度值，模板测试则根据模板缓冲区的值进行判断。

8. 混合

混合阶段将新生成的片段颜色与帧缓冲区中的现有颜色进行混合，以支持透明度和其他视觉效果。

优化策略

8.1 减少状态切换

频繁切换渲染状态（如材质、纹理、着色器）会增加CPU的开销。尽量将具有相同状态的物体分组在一起，以减少状态切换次数。

8.2 使用实例化绘制

实例化绘制允许在一次Draw Call中绘制多个相似的对象，从而减少Draw Call的数量。

Graphics.DrawMeshInstanced(mesh, 0, material, matrices);

8.3 批处理

批处理是将多个对象的顶点数据合并到一个缓冲区中，从而减少Draw Call的数量。Unity提供了静态批处理和动态批处理两种方式。

8.4 延迟渲染

延迟渲染将光照计算推迟到几何处理之后，从而减少光源数量对性能的影响。

8.5 使用Compute Shaders

Compute Shaders可以在GPU上执行通用计算任务，如粒子系统模拟、布料模拟等，从而减轻CPU的负担。

示例代码逻辑

以下是一个更详细的示例代码逻辑，展示了在一次Draw Call中可能涉及的代码逻辑：

// 准备阶段
void PrepareForDrawCall(Material material, Mesh mesh)
{
    // 设置材质和着色器
    Graphics.DrawMesh(mesh, transform.position, transform.rotation, material);

    // 绑定纹理
    foreach (var texture in material.textures)
    {
        Graphics.BindTexture(texture);
    }

    // 设置渲染目标
    Graphics.SetRenderTarget(renderTarget);

    // 启用深度测试
    Graphics.EnableDepthTesting(true);
}

// 执行阶段
void ExecuteDrawCall()
{
    // 发送绘制命令
    Graphics.DrawElements(PrimitiveType.Triangles, mesh.indexCount, DrawElementsType.UnsignedInt, 0);
}

// 结束阶段
void CleanupAfterDrawCall()
{
    // 解绑资源
    foreach (var texture in material.textures)
    {
        Graphics.UnbindTexture(texture);
    }

    // 重置渲染目标
    Graphics.SetRenderTarget(null);

    // 禁用深度测试
    Graphics.EnableDepthTesting(false);
}

结论

通过深入理解并优化这些步骤，你可以显著提高Unity应用的渲染性能和视觉效果。从顶点数据处理到混合阶段，每一步都需要细致的规划和测试。不断学习和实践，你将能够掌握这一强大工具并创造出令人惊叹的视觉作品。

在前面的讨论中，我们已经涵盖了Unity中一次Draw Call的主要执行流程和优化策略。接下来，我们将进一步探讨一些高级技术和最佳实践，以帮助你更深入地理解和优化渲染过程。

9. 使用GPU Instancing

GPU Instancing是一种高效的技术，允许你在单个Draw Call中渲染多个相同的对象实例。这对于渲染大量相似对象（如树木、草丛、粒子系统）非常有用。

// 使用GPU Instancing的示例
MaterialPropertyBlock props = new MaterialPropertyBlock();
props.SetMatrix("_WorldMatrix", worldMatrix);
Graphics.DrawMeshInstanced(mesh, 0, material, matrices, matrices.Length, props);

10. 使用LOD（Level of Detail）技术

LOD技术根据对象距离相机的远近，动态切换模型的细节层次。这可以显著减少渲染负载，同时保持视觉质量。

// LOD Group示例
LODGroup lodGroup = GetComponent<LODGroup>();
LOD[] lods = new LOD[3];
lods[0] = new LOD(0.5f, new Renderer[] { rendererHighDetail });
lods[1] = new LOD(1.0f, new Renderer[] { rendererMediumDetail });
lods[2] = new LOD(2.0f, new Renderer[] { rendererLowDetail });
lodGroup.SetLODs(lods);

11. 使用遮挡剔除（Occlusion Culling）

遮挡剔除是一种优化技术，通过检测哪些对象被其他对象遮挡，从而避免渲染这些不可见的对象。

// 启用遮挡剔除
Camera.main.useOcclusionCulling = true;

12. 使用多线程渲染

Unity支持多线程渲染，可以利用多核CPU的优势提高渲染效率。在自定义渲染管线中，你可以合理分配任务到不同的线程，如场景遍历、几何处理、光照计算等。

13. 使用Compute Shaders进行通用计算

Compute Shaders可以在GPU上执行通用计算任务，如粒子系统模拟、布料模拟和图像处理。以下是一个简单的Compute Shader示例：

// Compute Shader示例
ComputeShader computeShader = Resources.Load<ComputeShader>("MyComputeShader");
int kernelHandle = computeShader.FindKernel("CSMain");
computeShader.SetFloat("_Time", Time.time);
computeShader.Dispatch(kernelHandle, width / 8, height / 8, 1);

14. 使用HDR和色调映射

HDR（高动态范围）渲染可以处理更广泛的亮度范围，从而实现更真实的光照效果。色调映射技术可以将HDR颜色转换为适合显示设备的LDR（低动态范围）颜色。

// 启用HDR渲染
Camera.main.allowHDR = true;

15. 使用抗锯齿技术

抗锯齿可以减少图像中的锯齿状边缘，从而提高图像质量。Unity提供了多种抗锯齿技术，如MSAA（Multi-Sample Anti-Aliasing）、FXAA（Fast Approximate Anti-Aliasing）和SMAA（Subpixel Morphological Anti-Aliasing）。

// 启用MSAA
QualitySettings.antiAliasing = 4;

结论

通过深入探讨Unity中一次Draw Call的执行流程和优化策略，我们可以看到，这个强大的工具提供了丰富的功能和灵活性。从GPU Instancing到多线程渲染，每一步都需要细致的规划和测试。不断学习和实践，你将能够掌握这一强大工具并创造出令人惊叹的视觉作品。

你一身傲骨怎能输

关注

19
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫