x86平台上sse intrinsic中的操作数类型

一个同事的问题,让我澄清了很久以来对sse intrinsic 中的比如 __m128、__m128d 等类型的操作数的误解,所以在此记下来。intrinsic 的写法都在手册上,这里就不抄了……


比如一个双精度向量乘法的intrinsic:__m128d   _mm_mul_pd ( __m128d a, __m128d b ) ,我一直以为这里的 __m128d 类型必须是单个变量(因此可以放到寄存器里),常见的实例基本就把变量命名成 xmm1、xmm2 之类的了。如果需要操作内存,都是前后用load、store 类的intrinsic。其实 __m128d 这类型的变量,可以是内存变量,(当然,一定要是 16B 对齐的),返回值也可以是内存变量。


操作数能不能为内存对象,怎么决定的呢?一般通过查intel手册,找intrinsic 对应的硬件指令,可以看出来,指令中允许操作数为内存对象,intrinsic 里就可以写。那x86指令中指明了有一个操作数必须为寄存器呢?intrinsic 写法里,仍然可以都写内存变量(至少gcc 允许这么做),这说明支持intrinsic 的编译器更加聪明,从而intrinsic 使用起来,比内嵌汇编更容易。


反过来说,对比起来,汇编的可控性更强一些,跟实际执行的指令是对应的,而intrinsic 和指令并不完全对应,编译器仍然会在背后做一些事情:比如把两个内存操作数的intrinsic 拆分成两条指令(这是必须的),或者把一条load 和一条计算的intrinsic 合成一条x86指令,等等。另外,intrinsic 也不能控制代码运行使用的逻辑寄存器号码。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值