DirectX 9高效渲染之利用Constant构建渲染数据

1649 篇文章 11 订阅
1623 篇文章 22 订阅

http://www.cppblog.com/sunicdavy/archive/2010/07/27/121394.html

 

偶然一次查看RenderMonkey例子中的Particle System.rfx 的 FireParticleSystem 中发现了一种提高DX9渲染效率的设计方法

image

这里仅列出Vertex Shader参考:

 

   1:  float4x4 view_proj_matrix: register(c0);
   2:  float4x4 view_matrix: register(c4);
   3:  float time_0_X: register(c8);
   4:  float4 particleSystemPosition: register(c9);
   5:  float particleSystemShape: register(c10);
   6:  float particleSpread: register(c11);
   7:  float particleSpeed: register(c12);
   8:  float particleSystemHeight: register(c13);
   9:  float particleSize: register(c14);
  10:  // The model for the particle system consists of a hundred quads.
  11:  // These quads are simple (-1,-1) to (1,1) quads where each quad
  12:  // has a z ranging from 0 to 1. The z will be used to differenciate
  13:  // between different particles
  14:   
  15:  struct VS_OUTPUT {
  16:     float4 Pos: POSITION;
  17:     float2 texCoord: TEXCOORD0;
  18:     float color: TEXCOORD1;
  19:  };
  20:   
  21:  VS_OUTPUT main(float4 Pos: POSITION){
  22:     VS_OUTPUT Out;
  23:   
  24:     // Loop particles
  25:     float t = frac(Pos.z + particleSpeed * time_0_X);
  26:     // Determine the shape of the system
  27:     float s = pow(t, particleSystemShape);
  28:   
  29:     float3 pos;
  30:     // Spread particles in a semi-random fashion
  31:     pos.x = particleSpread * s * cos(62 * Pos.z);
  32:     pos.z = particleSpread * s * sin(163 * Pos.z);
  33:     // Particles goes up
  34:     pos.y = particleSystemHeight * t;
  35:   
  36:     // Billboard the quads.
  37:     // The view matrix gives us our right and up vectors.
  38:     pos += particleSize * (Pos.x * view_matrix[0] + Pos.y * view_matrix[1]);
  39:     // And put the system into place
  40:     pos += particleSystemPosition;
  41:   
  42:     Out.Pos = mul(view_proj_matrix, float4(pos, 1));
  43:     Out.texCoord = Pos.xy;
  44:     Out.color = 1 - t;
  45:   
  46:     return Out;
  47:  }

由于RenderMonkey本身只能使用Shader,而不能进行任何CPU方的算法设计,因此要实现一个例子系统,只能使用另外的方法,这个例子就是使用纯Shader来实现了一个粒子系统的效果。

注意第31,32行中出现的Pos.z,这是本例子最有参考价值的地方。如果把Particles这个模型引用的QuadArray.3ds用MAX打开你就能发现,这其实是一个多层叠出来的片, 每个片的间隔就是Pos.z。让我们来整理下渲染出例子的整个流程:

由QuadArray.3ds提供Vertex数据,也就是VertexBuffer.片状的VB数据被送入管线,然后由上面的VertexShader程序,通过Pos.z将他们切开,控制这些片的顶点重塑例子的外观。最后的PS只是简单的将光栅化后的像素点根据纹理采样显示出来。

2008年时,我曾经根据这个原理,设计了一套粒子系统,原理与这个差不多,只不过VB是由Constant设置进来,在DX10/11以上就叫ConstantBuffer。测试了下,传统的粒子系统,在我的本子上大约只能跑60多帧,但是这个不锁定VB的粒子系统却可以跑300多帧。

最近决定使用这个技术优化下我的引擎中绘制线段及片的系统,以下是VertexShader的代码:

#define VERTEX_COUNT 80
 
float4 PositionBuffer[VERTEX_COUNT];
float2 UVBuffer[VERTEX_COUNT];
float4 ColorBuffer[VERTEX_COUNT];
 
float4x4 Transform;
 
void Main(
    in float InIndex : TEXCOORD0,
    out float4 OutPosition : POSITION,
    out float2 OutTexCoord : TEXCOORD1,
    out float4 OutColor : COLOR0
    )
{
    OutPosition = mul( PositionBuffer[ InIndex ] , Transform );
    OutColor = ColorBuffer[ InIndex ];
    OutTexCoord = UVBuffer[ InIndex ];
}

这里有个细节需要注意。从最初分析看来,多边形的构造都是由Constant输入,并由VS代码构造,在VB中的数据好像只需要一个Index就够了。但是实际测试下来发现,这样是错误的,还是必须在顶点定义中添加绘制的基本元素,例如位置和纹理坐标。

DX9因为不开源,我们并不了解下面3种绘制方式的性能差异:

1. Constant发送

2. 锁定VB发送

3. DrawPrimitiveUP系列使用系统内建缓冲渲染

 

经过测试发现,DrawPrimitive在数据量小时,比锁定VB快些,而Constant发送方式没有DrawPrimitiveUP快。

因此,使用Constant发送多边形数据进行构造的方法在量小且固定的情况下对于性能提升是很有帮助的,但大量的顶点及变化的数据还是必须使用传统的方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据来源:中经数据库 主要指标110多个(全部都是纯粹的 市辖区 指标),大致是: GDP GDP增速 第一产业增加值占GDP比重 第二产业增加值占GDP比重 第三产业增加值占GDP比重 人均GDP 社会消费品零售总额 固定资产投资(不含农户) 新设外商投资企业数_外商直接投资 实际利用外资金额(美元) 一般公共预算收入 一般公共预算支出 一般公共预算支出_教育 一般公共预算支出_科学技术 金融机构人民币各项存款余额_个人储蓄存款 金融机构人民币各项存款余额 金融机构人民币各项贷款余额 规模以上工业企业单位数 规模以上工业企业单位数_内资企业 规模以上工业企业单位数_港澳台商投资企业 规模以上工业企业单位数_外商投资企业 规模以上工业总产值 规模以上工业总产值_内资企业 规模以上工业总产值_港澳台商投资企业 规模以上工业总产值_外商投资企业 规模以上工业企业流动资产合计 规模以上工业企业固定资产合计 规模以上工业企业利润总额 规模以上工业企业应交增值税 规模以上工业企业主营业务税金及附加 户籍人口数 年均户籍人口数 户籍人口自然增长率 第一产业就业人员占全部城镇单位就业人员比重 第二产业就业人员占全部城镇单位就业人员比重 第三产业就业人员占全部城镇单位就业人员比重 城镇非私营单位就业人员数 城镇非私营单位就业人员数_第一产业 城镇非私营单位就业人员数_第二产业 城镇非私营单位就业人员数_第三产业 城镇非私营单位就业人员数_农、林、牧、渔业 城镇非私营单位就业人员数_采矿业 城镇非私营单位就业人员数_制造业 城镇非私营单位就业人员数_电力、热力、燃气及水生产和供应业 城镇非私营单位就业人员数_建筑业 城镇非私营单位就业人员数_批发和零售业 城镇非私营单位就业人员数_交通运输、仓储和邮政业 城镇非私营单位就业人员数_住宿和餐饮业 城镇非私营单位就业人员数_信息传输、软件和信息技术服务业 城镇非私营单位就业人员数_金融业 城镇非私营单位就业人员数_房地产业 城镇非私营单位就业人员数_租赁和商务服务业 城镇非私营单位就业人员数_科学研究和技术服务业 城镇非私营单位就业人员数_水利、环境和公共设施管理业 城镇非私营单位就业人员数_居民服务、修理和其他服务业 城镇非私营单位就业人员数_教育 城镇非私营单位就业人员数_卫生和社会工作 城镇非私营单位就业人员数_文化、体育和娱乐业 城镇非私营单位就业人员数_公共管理、社会保障和社会组织 城镇非私营单位在岗职工平均人数 城镇就业人员数_私营企业和个体 城镇非私营单位在岗职工工资总额 城镇非私营单位在岗职工平均工资 城镇登记失业人员数 建成区面积 建设用地面积 建设用地面积_居住用地 液化石油气供气总量 液化石油气供气总量_居民家庭 人工煤气、天然气供气总量 人工煤气、天然气供气总量_居民家庭 液化石油气用气人口 人工煤气、天然气用气人口 城市公共汽电车运营车辆数 城市出租汽车运营车辆数 城市公共汽电车客运总量 道路面积 排水管道长度 建成区绿化覆盖面积 建成区绿化覆盖率 绿地面积 公园绿地面积 维护建设资金支出 土地面积 生活用水供水量 供水总量 全社会用电量 城乡居民生活用电量 工业生产用电量 房地产开发投资 房地产开发投资_住宅 限额以上批发和零售业法人单位数 限额以上批发和零售业商品销售总额 普通中学学校数 中等职业教育学校数 普通小学学校数 普通高等学校专任教师数 普通中学专任教师数 中等职业教育专任教师数 普通小学专任教师数 普通高等学校在校生数 普通中学在校生数 中等职业教育在校生数 普通小学在校生数 电视节目综合人口覆盖率 公共图书馆总藏量_图书 医疗卫生机构数_医院和卫生院 卫生人员数_执业(助理)医师 医疗卫生机构床位数_医院和卫生院 城镇职工基本养老保险参保人数 职工基本医疗保险参保人数 失业保险参保人数
以下是使用DirectX 12实现图片渲染纹理数据的示例代码: ```cpp // 初始化纹理资源 ID3D12Resource* textureResource = nullptr; D3D12_RESOURCE_DESC textureDesc = {}; textureDesc.Dimension = D3D12_RESOURCE_DIMENSION_TEXTURE2D; textureDesc.Width = textureWidth; textureDesc.Height = textureHeight; textureDesc.DepthOrArraySize = 1; textureDesc.MipLevels = 1; textureDesc.Format = DXGI_FORMAT_R8G8B8A8_UNORM; textureDesc.SampleDesc.Count = 1; textureDesc.Layout = D3D12_TEXTURE_LAYOUT_UNKNOWN; textureDesc.Flags = D3D12_RESOURCE_FLAG_NONE; ThrowIfFailed(device->CreateCommittedResource( &CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT), D3D12_HEAP_FLAG_NONE, &textureDesc, D3D12_RESOURCE_STATE_COPY_DEST, nullptr, IID_PPV_ARGS(&textureResource))); // 创建上传堆 ID3D12Resource* textureUploadHeap = nullptr; ThrowIfFailed(device->CreateCommittedResource( &CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_UPLOAD), D3D12_HEAP_FLAG_NONE, &CD3DX12_RESOURCE_DESC::Buffer(GetRequiredIntermediateSize(textureResource, 0, 1)), D3D12_RESOURCE_STATE_GENERIC_READ, nullptr, IID_PPV_ARGS(&textureUploadHeap))); // 将纹理数据复制到上传堆 D3D12_SUBRESOURCE_DATA textureData = {}; textureData.pData = imageData; // 图像数据指针 textureData.RowPitch = textureWidth * 4; // 每行字节数 textureData.SlicePitch = textureData.RowPitch * textureHeight; UpdateSubresources(commandList, textureResource, textureUploadHeap, 0, 0, 1, &textureData); // 将纹理资源从复制目标状态转换为常量状态 CD3DX12_RESOURCE_BARRIER textureBarrier = CD3DX12_RESOURCE_BARRIER::Transition( textureResource, D3D12_RESOURCE_STATE_COPY_DEST, D3D12_RESOURCE_STATE_PIXEL_SHADER_RESOURCE); commandList->ResourceBarrier(1, &textureBarrier); // 创建纹理描述符堆 CD3DX12_DESCRIPTOR_HEAP_DESC textureHeapDesc(D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV, 1, D3D12_DESCRIPTOR_HEAP_FLAG_SHADER_VISIBLE); ID3D12DescriptorHeap* textureDescriptorHeap = nullptr; ThrowIfFailed(device->CreateDescriptorHeap(&textureHeapDesc, IID_PPV_ARGS(&textureDescriptorHeap))); // 创建纹理资源视图 D3D12_SHADER_RESOURCE_VIEW_DESC textureViewDesc = {}; textureViewDesc.Format = textureDesc.Format; textureViewDesc.ViewDimension = D3D12_SRV_DIMENSION_TEXTURE2D; textureViewDesc.Texture2D.MipLevels = 1; device->CreateShaderResourceView(textureResource, &textureViewDesc, textureDescriptorHeap->GetCPUDescriptorHandleForHeapStart()); ``` 这个示例代码包括以下步骤: 1. 创建纹理资源,使用R8G8B8A8_UNORM格式存储像素数据。 2. 创建上传堆,将像素数据复制到上传堆中。 3. 使用`UpdateSubresources`函数将上传堆中的数据复制到纹理资源中。 4. 使用`CD3DX12_RESOURCE_BARRIER`将纹理资源从复制目标状态转换为常量状态。 5. 创建纹理描述符堆和纹理资源视图,使其在着色器中可见。 请注意,这只是一个示例代码,并且需要根据您的具体需要进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值