利用OpenCL对OpenCV并行化心得（2）

最新推荐文章于 2023-09-30 09:44:46 发布

lkchl

最新推荐文章于 2023-09-30 09:44:46 发布

阅读量4.3k

点赞数

文章标签： dst matrix 图像处理优化

本文链接：https://blog.csdn.net/lkchl/article/details/7980689

版权

本文探讨了在OpenCV中利用OpenCL进行图像处理时，如何应对ROI（感兴趣区域）的优化问题。通过示例代码解释了在处理非4的倍数列数时，如何通过对齐地址和丢弃无效数据来确保计算的正确性，从而提高处理效率。

摘要由CSDN通过智能技术生成

上文说到了没有ROI的情况下怎么优化add，现在看看有roi的情况。

ROI是opencv里面的一个特性，也可以说是图像处理库都有的特性，它的意思是对于整个一幅图像，只处理被ROI框起来的那一块，可以看做是一个mask。如果不注重性能，最简单的方法就是加上一个offset即可

__kernel void matrix_add(__global uchar* src1,__global uchar* src2, __global uchar* dst, int rows, int cols,int src1_step,int src2_step,int dst_step，int src1_offset, int src2_offset, int dst_offset)

{

int x=get_global_id(0);

int y=get_global_id(1);

if(x<cols&&y<rows)

dst[mad24(y,dst_step,x+dst_offset)]=src1[mad24(y,src1t_step,x+src1_offset)]+src2[mad24(y,src2_step,x+src2_offset)];

}

但是在每次读4个点的时候不能这么做，因为这有对齐问题。比如一个矩阵是17列1行，ROI设置的是后16个点，起始地址就不会是4的整数倍，这样在指针强制转换的时候会出现未定义的情况，结果是错的。除此之外，长度不是4的倍数也会出现问题，所以要使用一些技巧。一个办法是可以先强制对齐地址，多读一些数据，

最低0.47元/天解锁文章

lkchl

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫