1、 _mm_store_si128 ( __m128i *p, __m128i a);
指令名:void _mm_store_si128 ( __m128i *p, __m128i a);
功能:可存储128位数据;
说明:将__m128i 变量a的值存储到p所指定的变量中去;注意:p必须是一个16-bit对齐的一个变量的地址。
2、 _mm_storel_epi64( __m128i* a , __m128i b );
功能:只存储低64位数据;
说明:a是 一个要写入的内存中的__m128i 结构体变量指针; b是一个要读取(映射到XMM 硬件寄存器)的__m128i 结构体变量;
注意:a不要求必须是一个16-bit对齐的一个变量的地址。
3、 _mm_storeu_si128 ( __m128i *p, __m128i a);
指令名:void _mm_storeu_si128 ( __m128i *p, __m128i a);
功能:可存储128位数据;
说明:将__m128i 变量a的值存储到p所指定的变量中去;
注意:p不要求必须是一个16-bit对齐的一个变量的地址。
4、_mm_maskmoveu_si128( __m128i d, __m128i n, char *p);
指令名:void _mm_maskmoveu_si128( __m128i d, __m128i n, char *p);
功能:有条件选择的存储128位数据,且不要求内存16-bit对齐;
说明:根据n将d中的数值存储到p中去;
返回值:如果将n看做16个8位数值,则根据这16个8位数值的最高位(分界值为0x70/0x80)来决定是不是将16个8位d数值存储到p所指定的数组中去;
注意:该指令非常耗时,因为其功能强大,一般是其余存储指令执行时间的大约10倍。