convolution是图像处理中最常用的一个算法。
cuda sdk2.3中的convolution separable与以前版本有点不同,用同一个block去处理一系列相邻的图像块。这个不晓得为什么?
在俺的quadroFx5800上跑了跑,不同的ROWS_RESULT_STEPS也有不同的运行速度,不过每次运行的差别比较大。看到论坛里有人说这是为了资源均衡。。。还是不太理解
convolution是图像处理中最常用的一个算法。
cuda sdk2.3中的convolution separable与以前版本有点不同,用同一个block去处理一系列相邻的图像块。这个不晓得为什么?
在俺的quadroFx5800上跑了跑,不同的ROWS_RESULT_STEPS也有不同的运行速度,不过每次运行的差别比较大。看到论坛里有人说这是为了资源均衡。。。还是不太理解