矢量化的定义
矢量化执行的最高收益
矢量化执行过程
有个比较大的simd register
矢量化的选择
1.编译器层面自动矢量化执行
但是编译器为了防止错误的优化,比较保守,比如下面这个例子:
在z和x,y是同一个地址或者别的情况下,如果矢量化执行化,可能与顺序执行结果不一样。
2.编译提示
3. 自己手写并行程序
一些基础算子的并行操作
也存在问题,L1 cache在一个时钟周期内也只允许一次或者两次的访问
hash探测
水平
垂直
summary