在DEBUG模式下,使用CPU计算的骨骼动画总是很慢,当游戏中角色数目多的时候只有几帧,严重影响工作效率。今天测试了一下,774个顶点的模型在DEBUG下混合需要10ms,RELEASE下只需要0.3ms,DEBUG比RELEASE慢了30倍。
部分代码如下:
for( int i = 0; i < iNumBaseVertex; ++i )
{
v3dBlendInfo &bi = m_BlendInfoVec[i];
const v3dxVector3 position = m_UsingBasePosVec[i];
const v3dxVector3 normal = m_UsingBaseNormalVec[i];
for( int j = 0; j < bi.iEffectBoneCount; ++j )
{
// 顶点混合
}
}
做了如下修改后,DEBUG下只需1ms,RELEASE没变化,还是0.3ms:
v3dBlendInfo *pBlendInfoVec = &m_BlendInfoVec[0];
v3dVector3 *pUsingBasePosVec = &m_ UsingBasePosVec[0];
v3dVector3 *pUsingBaseNormalVec = &m_ UsingBaseNormalVec[0];
for( int i = 0; i < iNumBaseVertex; ++i )
{
v3dBlendInfo &bi = pBlendInfoVec[i];
const v3dxVector3 position = pUsingBasePosVec[i];
const v3dxVector3 normal = pUsingBaseNormalVec[i];
for( int j = 0; j < bi.iEffectBoneCount; ++j )
{
// 顶点混合
}
}
总结:DEBUG下STL容器的运算符(如[])都是函数调用,如果在多次循环内部做这些操作会严重影响效率。以后遇到这种情况可以先用STL将算法调正确,然后替换成快速的数组操作方便调试。RELEASE下STL许多函数都被INLINE,所以两种做法效率差不多。
谁有更好的办法, 一定要共享一下,嘿