1、位运算问题 CPU:value >> - bit_idx ==> GPU:value <<(32 - bit_idx)
2、opengl数据互操作:之间传输数据要经过host中转,所以效率低下;CUDA2.1beta不知道修改此功能没有,支持直接数据传输,不经过host,不浪费CPUpcie带宽??
1、位运算问题 CPU:value >> - bit_idx ==> GPU:value <<(32 - bit_idx)
2、opengl数据互操作:之间传输数据要经过host中转,所以效率低下;CUDA2.1beta不知道修改此功能没有,支持直接数据传输,不经过host,不浪费CPUpcie带宽??