快速内存拷贝

    C语言自带memcpy已优化的很好了,通过拷贝一幅图像,测得耗时为1.8ms,经过很多其他方法代换,都无法达到如此速度,为了提速,经过摸索,终于找到更快一点的方法。经测得耗时为1.35ms。

内存拷贝程序

void MemCopy(void *pDst, void *pSrc, DWORD dwSize)//顺序拷贝
{
	_asm
	{
		    mov esi, pSrc;  //传递源指针
		    mov edi, pDst;  //传递目标指针
		    mov ebx, dwSize;//ebx 字节计数
		    shr ebx, 7;     //除 128 (8 * 128bit registers)
	  L1:
		    movdqu xmm0, 0[ESI]; //从内存移动数据到寄存器
		    movdqu xmm1, 16[ESI];
		    movdqu xmm2, 32[ESI];
		    movdqu xmm3, 48[ESI];
		    movdqu xmm4, 64[ESI];
		    movdqu xmm5, 80[ESI];
		    movdqu xmm6, 96[ESI];
		    movdqu xmm7, 112[ESI];

		    movntdq 0[EDI], xmm0; //从寄存器移动数据到内存
		    movntdq 16[EDI], xmm1;
		    movntdq 32[EDI], xmm2;
		    movntdq 48[EDI], xmm3;
		    movntdq 64[EDI], xmm4;
		    movntdq 80[EDI], xmm5;
		    movntdq 96[EDI], xmm6;
		    movntdq 112[EDI], xmm7;

		    add esi, 128;
		    add edi, 128;
		    dec ebx; //减1
		    jnz L1;  //不为0循环

	  	    mov ecx, dwSize;
		    and ecx, 127;
		    rep movsb; //余数循环
	}
}

用完了8个多媒体寄存器,每个寄存器每次传输16个字节,用到了内存拷贝极限。

在vs2017的C++调试通过。

转载于:https://www.cnblogs.com/hbg200/p/9563283.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值