- 博客(7)
- 收藏
- 关注
原创 CUDA-GPU programming Introduction (5)
Reduction with CUDAreduciton指的是min/max,sum, average等操作,不难发现这些操作都很难做到高度并行。一直也是并行计算里的典型瓶颈。没什么好的处理方法,基本处理就是两种: binary reduction atomic reduction前者就是二分法处理,两两相加,逐步reduction,后者具体参见cuda的官方文档
2017-05-15 14:54:28 422
原创 CUDA-GPU programming Introduction (4)
Concurrent execution and streams如果使用GPU的stream设置增加device操作的并行性
2017-05-15 13:08:46 245
原创 CUDA-GPU programming Introduction (3)
关于提高performance的一些建议: 内存的读写方式,shared memory的调用,bank confict的解决
2017-05-14 11:49:18 367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人