![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
kongnge
关注机器学习,计算机视觉,图像处理。
展开
-
卷积操作的GPU粗粒度并行实现及测试
卷积操作的GPU粗粒度并行实现及测试一、 算法基本思想:1、 GPU中的一个线程产生一个卷积结果,有多少个结果就使用多少个Block;2、 矩阵和卷积核存放在共享内存中,卷积结果存放在全局内存中;3、 支持10000以内任意维度的二维矩阵,卷积核最大支持16x16。4、 支持任意多幅图像的批处原创 2015-03-02 10:39:48 · 3253 阅读 · 1 评论 -
卷积操作的GPU粗粒度并行实现及测试(优化)
卷积操作的GPU粗粒度并行实现及测试一、 算法基本思想:1、 GPU中的一个线程产生一个卷积结果,有多少个结果就使用多少个Block;2、 矩阵和卷积核存放在共享内存中,卷积结果存放在全局内存中;3、 支持10000以内任意维度的二维矩阵,卷积核最大支持16x16。4、 支持任意多幅图像的批处理。原创 2015-03-02 10:43:06 · 1982 阅读 · 0 评论