intrin用起来有点不方便哦

文章描述了一段C++代码,其中使用了__declspec(align)进行内存对齐,并在循环中应用_mm_cmpestri和movdqa指令处理字符串。当循环进入第二轮时,由于地址不再16字节对齐导致movdqa指令出错。解决方案是创建一个ASM文件,直接使用pcmpestri和movdqu指令来避免对齐问题。
摘要由CSDN通过智能技术生成

    __declspec(align(32)) char buff[17] = "aaaaaaaaaaaaaaaa";
    __declspec(align(32)) char key[32] = "ab";
    int buflen = strlen(buff);
    int keylen = strlen(key);
    int step = 16-keylen;
    int c;
    char *p = NULL;
    for(int i = 0; i < buflen; i+=step)
    {
        c = _mm_cmpestri(*(__m128i*)key, keylen, *(__m128i*)&(buff[i]), buflen-i, 12);
        if (c <= step)
        {
            p = buff + i + c;
            break;
        }
    }

被编译成:
movdqa      xmm0,xmmword ptr [ebp+eax-40h]  
mov         eax,dword ptr [ebp-98h]  
movdqa      xmm1,xmmword ptr [ebp-80h]  
pcmpestri   xmm1,xmm0,0Ch  

用的都是需要对齐的指令,循环第一轮的时候没问题;第二轮的时候,i+=14,这时候地址就不是16字节对齐了,movdqa就挂了。所以还是新建个asm文件,直接使用pcmpestri指令把,这样的话,加载就可以用movdqu了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值