今天发现NV的计算单元居然是Scalar ALU, 挺意外啊,
AMD,Imagination, Intel, Qualcomm的平台都是用的SIMD
按照理论分析,SIMD的指令密集度肯定更高
全部用Scalar ALU的好处是编译器,调度器更加容易实现,调度也不容易有泡泡
这也可能是NV的Cuda确实好用的一个原因,
对比了AMD和NV在相同晶体管下的理论计算性能,确实AMD的更高。
但是关键还是调度的效率,NV的调度效率肯定更好了
今天发现NV的计算单元居然是Scalar ALU, 挺意外啊,
AMD,Imagination, Intel, Qualcomm的平台都是用的SIMD
按照理论分析,SIMD的指令密集度肯定更高
全部用Scalar ALU的好处是编译器,调度器更加容易实现,调度也不容易有泡泡
这也可能是NV的Cuda确实好用的一个原因,
对比了AMD和NV在相同晶体管下的理论计算性能,确实AMD的更高。
但是关键还是调度的效率,NV的调度效率肯定更好了