OpenCL编程:图像卷积

转载 2016年05月13日 17:35:19
图像卷积,就是对图像所有像素进行一些特定的运算处理。这里涉及两个问题,一是读取图片文件信息,二是作何种卷积运算。第一个问题可在《freeimage存取图片数据》里找到答案。第二个问题可以baidu卷积算法。
    卷积是对每个像素都进行相同的处理。以前我们是用CPU来串行处理。现在我们可以利用OPENCL进行并行处理(多核CPU和GPU)。

我们的例子很简单,是一个对图片进行低通滤波处理。卷积大小是5×5,为了方便,对边缘像素不做处理(反正也就2个像素,肉眼看不出)。

low.cl源码
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
__kernel void low(__global int* A,
                    __global int* B,
                    __global int* C,
                    int sum,
                    int img_width,
                    int kernel_width)
{
    //获取索引号,这里是二维的,所以可以取两个
    //否则另一个永远是0
    int col = get_global_id(0);
    int row = get_global_id(1);
   
    int stx = (kernel_width - kernel_width%2)/2;
    int sty = stx;
   
    int nx,ny;
    int totalR=0;
    int totalG=0;
    int totalB=0;
    int nid = 0;
 
    totalR=0;totalG=0;totalB=0;
    nid=0;
 
  if(col<=2 || row<=2 || col>=img_width-2 || row>=img_width-2)
  {
     B[row*img_width*3+col*3+0] = 0;
     B[row*img_width*3+col*3+1] = 0;
     B[row*img_width*3+col*3+2] = 0;
     return;
   }
 
   for(ny=row-sty;ny<=row+sty;ny++)
    {
        for(nx=col-stx;nx<=col+stx;nx++)
        {
            totalR += C[nid] * A[ny*img_width*3+nx*3+0];
            totalG += C[nid] * A[ny*img_width*3+nx*3+1];
            totalB += C[nid] * A[ny*img_width*3+nx*3+2];
   
             nid++;
        }
    }
   
    B[row*img_width*3+col*3+0] = min(255,totalR/sum);
    B[row*img_width*3+col*3+1] = min(255,totalG/sum);
    B[row*img_width*3+col*3+2] = min(255,totalB/sum);
}


main.cpp源码
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
#include <iostream>
#include <stdio.h>
#include <string.h>
#include <string>
#include <conio.h>
#include <math.h>//数学库
#include <CL/cl.h>//包含CL的头文件
//调用freeimage
#include <freeimage.h>
  
using namespace std;
  
//8x8数组
const int dim_x = 256;
const int dim_y = 256;
const int kernel_x =5;
const int kernel_y =5;
  
static int buf_A[dim_x*dim_y*3];
static int buf_B[dim_x*dim_y*3];
static int buf_C[] = {
    1,1,1,1,1,
    1,4,4,4,1,
    1,4,12,4,1,
    1,4,4,4,1,
    1,1,1,1,1
};
  
//加载图片
//以RGBA格式存储图片
static bool LoadImg(const char* fname)
{
    //初始化FreeImage
    FreeImage_Initialise(TRUE);
  
    //定义图片格式为未知
    FREE_IMAGE_FORMAT fif = FIF_UNKNOWN;
  
    //获取图片格式
    fif = FreeImage_GetFileType(fname,0);
  
    //根据获取格式读取图片数据
    FIBITMAP* bitmap = FreeImage_Load(fif,fname,0);
  
    if(!bitmap)
    {
        printf("load error!
");
        return false;
    }
  
    int x,y;
    RGBQUAD m_rgb;
  
    //获取图片长宽
    int width = (int)FreeImage_GetWidth(bitmap);
    int height = (int)FreeImage_GetHeight(bitmap);
  
    //获取图片数据
    //按RGBA格式保存到数组中
    for(y=0;y<height;y++)
    {
        for(x=0;x<width;x++)
        {
            //获取像素值
            FreeImage_GetPixelColor(bitmap,x,y,&m_rgb);
  
            //将RGB值存入数组
            buf_A[y*width*3+x*3+2] = m_rgb.rgbRed;
            buf_A[y*width*3+x*3+1] = m_rgb.rgbGreen;
            buf_A[y*width*3+x*3+0] = m_rgb.rgbBlue;
  
        }
    }
  
    FreeImage_Unload(bitmap);
    return true;
}
  
//保存图片
static bool SaveImg()
{
    //初始化FreeImage
    FreeImage_Initialise(TRUE);
  
    FIBITMAP* bitmap =FreeImage_Allocate(dim_x,dim_y,32,8,8,8);
  
    int m,n;
  
    for(n=0;n<dim_y;n++)
    {
        BYTE *bits =FreeImage_GetScanLine(bitmap,n);
  
        for(m=0;m<dim_x;m++)
        {
            bits[0] = buf_B[dim_x*3*n+m*3+0];
            bits[1] = buf_B[dim_x*3*n+m*3+1];
            bits[2] = buf_B[dim_x*3*n+m*3+2];
            bits[3] = 255;
            bits+=4;
        }
    }
  
    //保存图片为PNG格式
    if(false ==FreeImage_Save(FIF_PNG, bitmap,"low.png", PNG_DEFAULT))
    {
        printf("save image error
");
    }
  
    FreeImage_Unload(bitmap);
    return true;
}
  
//从外部文件获取cl内核代码
bool GetFileData(const char* fname,string& str)
{
    FILE* fp = fopen(fname,"r");
    if(fp==NULL)
    {
        printf("no found file
");
        return false;
    }
  
    while(feof(fp)==0)
    {
        str += fgetc(fp);
    }
  
    return true;
}
  
int main()
{
    if(LoadImg("bk.png")==false)
    {
        printf("error load bk.png!
");
        return 0;
    }
    //先读外部CL核心代码,如果失败则退出。
    //代码存buf_code里面
    string code_file;
  
    if(false == GetFileData("low.cl",code_file))
    {
        printf("Open low.cl error
");
        return 0;
    }
  
    char* buf_code = new char[code_file.size()];
    strcpy(buf_code,code_file.c_str());
    buf_code[code_file.size()-1] = NULL;
  
    //声明CL所需变量。
    cl_device_id device;
    cl_platform_id platform_id = NULL;
    cl_context context;
    cl_command_queue cmdQueue;
    cl_mem bufferA,bufferB,bufferC;
    cl_program program;
    cl_kernel kernel = NULL;
  
    //我们使用的是二维向量
    //设定向量大小(维数)
    size_t globalWorkSize[2];
    globalWorkSize[0] = dim_x;
    globalWorkSize[1] = dim_y;
  
    cl_int err;
  
    /*
        定义输入变量和输出变量,并设定初值
    */
  
    size_t datasize = sizeof(int) * dim_x * dim_y * 3;
    size_t kernelsize = sizeof(int)*kernel_x*kernel_y;
  
    int n=0;
    int sum=0;
    //计算卷积核元素之和
    for(n=0;n<25;n++)
    {
        sum += buf_C[n];
    }
  
    //step 1:初始化OpenCL
    err = clGetPlatformIDs(1,&platform_id,NULL);
  
    if(err!=CL_SUCCESS)
    {
        cout<<"clGetPlatformIDs error:"<<err<<endl;
        return 0;
    }
  
    //这次我们只用CPU来进行并行运算,当然你也可以该成GPU
    clGetDeviceIDs(platform_id,CL_DEVICE_TYPE_CPU,1,&device,NULL);
  
    //step 2:创建上下文
    context = clCreateContext(NULL,1,&device,NULL,NULL,NULL);
  
    //step 3:创建命令队列
    cmdQueue = clCreateCommandQueue(context,device,0,NULL);
  
    //step 4:创建数据缓冲区
    bufferA = clCreateBuffer(context,
                             CL_MEM_READ_ONLY,
                             datasize,NULL,NULL);
  
    bufferB = clCreateBuffer(context,
                             CL_MEM_WRITE_ONLY,
                             datasize,NULL,NULL);
  
    bufferC = clCreateBuffer(context,
                             CL_MEM_READ_ONLY,
                             kernelsize,NULL,NULL);
  
    //step 5:将数据上传到缓冲区
    clEnqueueWriteBuffer(cmdQueue,
                         bufferA,CL_FALSE,
                         0,datasize,
                         buf_A,0,
                         NULL,NULL);
  
    clEnqueueWriteBuffer(cmdQueue,
                         bufferC,CL_FALSE,
                         0,kernelsize,
                         buf_C,0,
                         NULL,NULL);
  
    //step 6:加载编译代码,创建内核调用函数
    program = clCreateProgramWithSource(context,1,
                                        (const char**)&buf_code,
                                        NULL,NULL);
  
    clBuildProgram(program,1,&device,NULL,NULL,NULL);
  
    kernel = clCreateKernel(program,"low",NULL);
  
    //step 7:设置参数,执行内核
    clSetKernelArg(kernel,0,sizeof(cl_mem),&bufferA);
    clSetKernelArg(kernel,1,sizeof(cl_mem),&bufferB);
    clSetKernelArg(kernel,2,sizeof(cl_mem),&bufferC);
    clSetKernelArg(kernel,3,sizeof(cl_int),&sum);//卷积元素之和
    clSetKernelArg(kernel,4,sizeof(cl_int),&dim_x);   //图片宽度
    clSetKernelArg(kernel,5,sizeof(cl_int),&kernel_x);//卷积核宽度
  
    //注意这里第三个参数已经改成2,表示二维数据。
    clEnqueueNDRangeKernel(cmdQueue,kernel,
                           2,NULL,
                           globalWorkSize,
                           NULL,0,NULL,NULL);
  
    //step 8:取回计算结果
    clEnqueueReadBuffer(cmdQueue,bufferB,CL_TRUE,0,
                        datasize,buf_B,0,NULL,NULL);
  
    SaveImg();
  
    //释放所有调用和内存
  
    clReleaseKernel(kernel);
    clReleaseProgram(program);
    clReleaseCommandQueue(cmdQueue);
    clReleaseMemObject(bufferA);
    clReleaseMemObject(bufferB);
    clReleaseContext(context);
  
    delete buf_code;
  
    return 0;
}
源图
OpenCL编程(9):图像卷积 _重明鸟网站_www.cmnsoft.com

处理后图片(黑色是边缘没有处理部分)

OpenCL编程(9):图像卷积 _重明鸟网站_www.cmnsoft.com


http://www.cmnsoft.com/article.php?id=39

关于《OPENCL异构并行计算》中卷积优化的分析

《OPENCL异构并行计算》中讲了如何利用OPENCL进行卷积运算,并给出了使用局部存储器优化的例子,这里对其进行简单分析...
  • qq_20028731
  • qq_20028731
  • 2017-04-16 17:13:39
  • 724

OpenCL 优化后的卷积代码

自己修改过的 可以直接运行 卷积模板
  • chao56789
  • chao56789
  • 2016-01-07 19:49:08
  • 1216

使用OpenCL+OpenCV实现图像卷积(一)

基于VS2010,使用OpenCL+OpenCV实现图像卷积处理。
  • icamera0
  • icamera0
  • 2017-06-08 07:50:00
  • 1170

OpenCL与CNN篇四:CNN从入门到使用

记录我从零到实现一个具体CNN网络中最有用的知识干货。 以细节为切入点,分享我对CNN网络的简洁。 本文致力于让你一篇文章理解CNN的具体实现与训练方法。 涉及理论不一一追述背景,主要讲解其如何应用。...
  • ShiAokai
  • ShiAokai
  • 2017-06-10 01:08:45
  • 1094

使用OpenCL+OpenCV实现图像卷积(二)

基于VS2010,使用OpenCL+OpenCV实现图像卷积处理。
  • icamera0
  • icamera0
  • 2017-06-08 07:59:34
  • 1544

OpenCL做并行滤波

本实验主要进行OpenCL一维信号的滤波;主要思路是以离散信号的序列点作为目标,一个工作项负责一个信号点的计算;这样做的好处是方便,相对于串行实现获得相当大的性能提升;但是每个工作项负载不均衡。...
  • u011028771
  • u011028771
  • 2016-10-15 11:25:31
  • 437

OpenCL实现序列卷积

在上一篇博客中讲解了卷积和滤波的区别,本文主要介绍利用OpenCL如何在GPU上实现序列卷积。采用上文中的第一种方法实现:...
  • u011028771
  • u011028771
  • 2016-10-04 13:51:02
  • 415

基于OpenCL的图像积分图算法实现

积分图的概念图像积分图算法在图像特征检测中有着比较广泛的应用,主要用于规则区域特征值的计算。 积分图的概念可用下图表示: 坐标A(x,y)的积分图是其左上角的所有像素之和(图中的阴影部分)。定义为...
  • 10km
  • 10km
  • 2016-03-12 16:51:50
  • 1867

opencl:C++实现双线性插值图像缩放

用OpenCL实现图像缩放代码是比较简单的,因为OpenCL本身就支持双线性插值 下面是kernel代码(从Mali OpenCL SDK 抄来的:/samples/image_scaling/as...
  • 10km
  • 10km
  • 2016-02-27 16:20:24
  • 3201

No.6_1 OpenCL 图像采样器——图像裁剪

使用 OpenCL 采样器,从原始图像中截取部分矩形区域(左下角区域开始)。
  • Bob_Dong
  • Bob_Dong
  • 2017-03-21 19:36:29
  • 1433
收藏助手
不良信息举报
您举报文章:OpenCL编程:图像卷积
举报原因:
原因补充:

(最多只允许输入30个字)