Designing Fast Cross-Platform SIMD Vector Libraries

是对这篇文章的笔记:

http://www.gamasutra.com/view/feature/4248/designing_fast_crossplatform_simd_.php?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed:+GamasutraFeatureArticles+(Gamasutra+Feature+Articles)

 

作者对simd方面有比较好的积累和研究,写一个高效的数学库。这篇文章主要比较实用的收获就是:

  • xna 数学库不是盖的,一般自己随便写写pc程序的话就不用费力去自己搞个更高效的数学库了。
  • intel自己编译器生成代码要比windows自带编译器要快,所以估计可以考虑弄个launcher,游戏编译2个版本出来,intel一个amd一个,根据processor选。

其他有点过于细节,加深下理解可以,实用价值比较有限。

 

think in hardware&low level stuff

 

现代cpu的vector计算部分很了得,写的好的,4个float的mad一个cycle搞定,写的不好的,就一个一个算了。

所以要解决的问题就是如何写出这样执行很快的指令。

 

1,使用intrinsics指令和数据结构有助于compiler生成高效代码(废话!)

2,注意一些情况,会导致compiler生成高效代码失败,文中提到一个class内部放__m128的情况

3,think in hardware,文中举了一个scaler的例子,其中很多register的load/write是可以避免的----这个还是直接去看user manual和生成汇编来的直接。

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值