不要在DEBUG模式下使用STL实现"复杂的"算法

最新推荐文章于 2022-09-04 11:44:31 发布

原创最新推荐文章于 2022-09-04 11:44:31 发布 · 9.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #测试 #游戏 #工作

本文针对DEBUG模式下骨骼动画计算效率低的问题，通过改进代码结构，大幅提升了处理速度。从使用对象指针替代容器直接访问的方法入手，实现了从10ms到1ms的性能飞跃。

部署运行你感兴趣的模型镜像

在DEBUG模式下，使用CPU计算的骨骼动画总是很慢，当游戏中角色数目多的时候只有几帧，严重影响工作效率。今天测试了一下，774个顶点的模型在DEBUG下混合需要10ms，RELEASE下只需要0.3ms，DEBUG比RELEASE慢了30倍。

部分代码如下：
for( int i = 0; i < iNumBaseVertex; ++i )
{
  v3dBlendInfo   &bi = m_BlendInfoVec[i];
  const v3dxVector3  position = m_UsingBasePosVec[i];
  const v3dxVector3  normal = m_UsingBaseNormalVec[i];

  for( int j = 0; j < bi.iEffectBoneCount; ++j )
  {
   // 顶点混合
  }
}

做了如下修改后，DEBUG下只需1ms，RELEASE没变化，还是0.3ms：
v3dBlendInfo *pBlendInfoVec = &m_BlendInfoVec[0];
v3dVector3 *pUsingBasePosVec = &m_ UsingBasePosVec[0];
v3dVector3 *pUsingBaseNormalVec = &m_ UsingBaseNormalVec[0];
for( int i = 0; i < iNumBaseVertex; ++i )
{
  v3dBlendInfo   &bi = pBlendInfoVec[i];
  const v3dxVector3  position = pUsingBasePosVec[i];
  const v3dxVector3  normal = pUsingBaseNormalVec[i];

  for( int j = 0; j < bi.iEffectBoneCount; ++j )
  {
   // 顶点混合
  }
}

总结：DEBUG下STL容器的运算符(如[])都是函数调用，如果在多次循环内部做这些操作会严重影响效率。以后遇到这种情况可以先用STL将算法调正确，然后替换成快速的数组操作方便调试。RELEASE下STL许多函数都被INLINE，所以两种做法效率差不多。

谁有更好的办法, 一定要共享一下,嘿

您可能感兴趣的与本文相关的镜像

Linly-Talker

AI应用

Linly-Talker是一款创新的数字人对话系统，它融合了最新的人工智能技术，包括大型语言模型（LLM）、自动语音识别（ASR）、文本到语音转换（TTS）和语音克隆技术