这两天在学习shader,记录一下shader学习的内容,方便自己以后查看,如果有什么错误的地方,也请帮我指出共勉,谢谢!
shader的渲染流水线类似于工厂的流水线制作类似,工作任务在于由一个三维场景出发,生成(或者说是渲染)一张二维图像,这个工作通常是由cpu和gpu共同完成的
渲染流程大致可以分为三个阶段,即应用阶段,几何阶段,光栅化阶段
应用阶段:这个阶段是由应用主导的,通常由cpu实现.
(1)把数据加载到显存中
把所有需要渲染的数据从硬盘加载到系统内存中,网格和纹理等数据被加载到显存中
(2)设置渲染状态
渲染状态即:这些状态定义了场景中的网格是怎样被渲染的,例如,使用哪个顶点着色器/片元着色器,光源属性,材质等
(3)调用DrawCall
准备好上述工作后,CPU向命令缓冲区加入一条指令,告诉GPU"嘿.老兄,我把数据都准备好了,你可以按照我的设置来渲染了",这个渲染命令即DrawCall
几何阶段:这个阶段用于处理所有和我们要绘制的几何相关的事情,通常由GPU实现
顶点着色器->曲面细分着色器->几何着色器->裁剪->屏幕映射
光栅化阶段:这一阶段将会使用上个阶段传递的数据来产生屏幕上的像素,并渲染出最终图像,这一阶段也是在GPU上运行的
三角形设置->三角形遍历->片元着色器->逐片元操作->屏幕图像
OpenGL左下角为最小窗口坐标值,DirectX左上角为最小窗口坐标值
减少DrawCall:
GPU的渲染能力是很强的,渲染200个还是2000个三角网格通常没什么区别,,因此渲染速度渲染速度往往快于CPU提交命令的速度.如果DrawCall数量太多,CPU就会把大量时间花费在提交DrawCall上,造成CPU过载.
批处理是一种很好减少DrawCall的方法把很多小的DrawCall合并成一个大的DrawCall,这就是批处理的思想,批处理技术比较适合静态的物体,如大地,石头等
附录:今天写的一个非常简单的顶点着色器
Shader "Custom/MyShader"{
Properties {
_Int("int",Int)=2
_Float("float",float)=1.5
_Rang("Range",Range(0,5) )=3
_Color("Color",Color)=(1,1,1,1)
_Vector("Vector",Vector)=(2,3,4,6)
_2D("2D",2D)=""{}
_Cube("cube",Cube)="white"{}
_3D("3D",3D)="black"{}
}
SubShader{
Pass{
CGPROGRAM
#pragma vertex vert
#pragma fragment frag
//Properties面板定义之后还需要在cg中定义
fixed4 _Color;
struct a2v{
float4 vertex :POSITION;
float3 normal:NORMAL;
float4 texcoord:TEXCOORD;
};
//float4 vert(a2v v):SV_POSITION{
// return mul(UNITY_MATRIX_MVP,v.vertex);
//}
struct v2f{
float4 pos:SV_POSITION;
fixed3 color:COLORO;
};
v2f vert(a2v v){
v2f o;
o.pos= mul(UNITY_MATRIX_MVP,v.vertex);
o.color=v.normal*0.5+fixed3(0.5,0.5,0.5);
return o;
}
float4 frag(v2f i):SV_TARGET{
fixed3 c=i.color;
c*=_Color.rgb;
return fixed4(c,1.0);
}
ENDCG
}
}
FallBack "Diffuse"
}
对于需要渲染的每一帧,CPU 将处理如下工作:
1.检查场景中所有物体,判断其是否需要被渲染。物体需要是否需要被渲染要满足一系列的条件,例如其是否在摄像机的视锥体中等。不会被渲染的物体被称为被剔除(culled)。
2.收集并排序所有需要渲染的物体相关信息并整理为通常所说的draw calls命令。一个draw call 包含了一个网格(mesh) 数据以及如何对其进行渲染的数据。例如,将会需要使用哪个纹理(texture)等等。在某些情况下,使用同一组设置信息的物体可能被组合起来成为一个draw call。将不同物体的数据合并为一个draw call 的过程称为batching。
3.为每一个draw call 创建一个通常所说的“批次”(batch)的数据包。Batch 中有时候可能包含draw call 之外的数据。
对于每个包含了draw call 的batch,CPU 将继续如下工作:
1.CPU可能会发送一些命令用于变更GPU 一系列渲染相关的变量,这些变量被统称为渲染状态(render state),这些命令本身就是通常所说的SetPass call。一个SetPass call 告知GPU 哪些设置将被用于渲染下一个网格。仅当下一个需要被渲染的网格需要变更渲染状态的时候才需要发送。
2.CPU 发送draw call 给GPU。Draw call 指示GPU 使用最近发送的SetPass Call 所提供的设置来渲染特定的网格。
3.在有些情况下,一个batch 可能需要多于一个的pass。Pass 是着色器(shader)代码中的一节,一个新的pass 需要对render state 进行变更。对于batch 中的每一个pass,CPU 将发送一个新的SetPass call 并且再次发送draw call。
GPU 在渲染流程中主要做如下工作:
1.按照CPU 的发送顺序处理渲染任务。
2.如果当前的任务是个SetPass call,GPU 更新render state。
3.如果当前的任务是个draw call,GPU 渲染该mesh。此过程按照shader 代码的不同段落分步有序进行,此过程较为复杂,简单来说,其中一段称为顶点着色器(vertex shader)的代码告知GPU 如何处理网格的顶点,另一段称为片段着色器(fragment shader)的代码告知GPU 如何绘制每一个像素。
4.重复上述工作直至CPU 下发的所有任务均被GPU 处理完毕。
在Unity 的渲染进程中包含三种类型的线程:
1.main thread:绝大多数CPU 任务在main thread 中完成,包括一些渲染任务。
2.render thread:用于向GPU 发送命令的特殊线程。
3.worker thread:每个worker thread 用于完成一个独立的任务,如culling 等。