关闭

不要在DEBUG模式下使用STL实现"复杂的"算法

标签: 算法测试游戏工作
7643人阅读 评论(5) 收藏 举报

在DEBUG模式下,使用CPU计算的骨骼动画总是很慢,当游戏中角色数目多的时候只有几帧,严重影响工作效率。今天测试了一下,774个顶点的模型在DEBUG下混合需要10ms,RELEASE下只需要0.3ms,DEBUG比RELEASE慢了30倍。

部分代码如下:
 for( int i = 0; i < iNumBaseVertex; ++i )
 {
  v3dBlendInfo   &bi = m_BlendInfoVec[i];
  const v3dxVector3  position = m_UsingBasePosVec[i];
  const v3dxVector3  normal = m_UsingBaseNormalVec[i];

  for( int j = 0; j < bi.iEffectBoneCount; ++j )
  {
   // 顶点混合
  }
 }

做了如下修改后,DEBUG下只需1ms,RELEASE没变化,还是0.3ms:
 v3dBlendInfo *pBlendInfoVec  = &m_BlendInfoVec[0];
 v3dVector3 *pUsingBasePosVec  = &m_ UsingBasePosVec[0];
 v3dVector3 *pUsingBaseNormalVec  = &m_ UsingBaseNormalVec[0];
 for( int i = 0; i < iNumBaseVertex; ++i )
 {
  v3dBlendInfo   &bi = pBlendInfoVec[i];
  const v3dxVector3  position = pUsingBasePosVec[i];
  const v3dxVector3  normal = pUsingBaseNormalVec[i];

  for( int j = 0; j < bi.iEffectBoneCount; ++j )
  {
   // 顶点混合
  }
 }

总结:DEBUG下STL容器的运算符(如[])都是函数调用,如果在多次循环内部做这些操作会严重影响效率。以后遇到这种情况可以先用STL将算法调正确,然后替换成快速的数组操作方便调试。RELEASE下STL许多函数都被INLINE,所以两种做法效率差不多。


谁有更好的办法, 一定要共享一下,嘿

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:141060次
    • 积分:1709
    • 等级:
    • 排名:千里之外
    • 原创:14篇
    • 转载:2篇
    • 译文:1篇
    • 评论:63条
    最新评论