本人采用了intel SSE指令集,来加速程序执行时间
比如一个memcpy 函数,本人优化成如下:
WORD * pDest,*pSrc;
pDest = ReadBuffer;
pSrc = SwitchBuffer ;
int nCount = 320*240*sizeof(WORD) / 16;
__asm
{
mov ESI, pSrc
mov EDI, pDest
mov ecx, nCount
loop1:
movdqa xmm0, [ESI]
movdqa [EDI], xmm0
add esi,16
add edi,16
dec ecx
jnz loop1
}
关于在PC机上获得程序的高性能研究
最新推荐文章于 2022-01-28 16:01:12 发布