matlab中conv2函数的算法,MATLAB conv2卷积的实现 | 学步园

二维卷积的

74a42ac4d15f165c807bd64d52a98884.png

这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:

#include "fiv_core.h"

typedef enum{

FIV_CONV2_SHAPE_FULL,

FIV_CONV2_SHAPE_SAME,

FIV_CONV2_SHAPE_VALID

}FIV_CONV_SHAPE;

void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)

{

int src_row = src_mat->rows;

int src_cols = src_mat->cols;

int kernel_row = kernel_mat->rows;

int kernel_cols = kernel_mat->cols;

int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;

int i,j, kernel_i,kernel_j,src_i,src_j;

fIvMat* ptr_dst_mat = NULL;

switch(shape){

case FIV_CONV2_SHAPE_FULL:

dst_row = src_row + kernel_row - 1;

dst_cols = src_cols + kernel_cols - 1;

edge_row = kernel_row - 1;

edge_cols = kernel_cols - 1;

break;

case FIV_CONV2_SHAPE_SAME:

dst_row = src_row;

dst_cols = src_cols;

edge_row = (kernel_row - 1) / 2;

edge_cols = (kernel_cols - 1) / 2;

break;

case FIV_CONV2_SHAPE_VALID:

dst_row = src_row - kernel_row + 1;

dst_cols = src_cols - kernel_cols + 1;

edge_row = edge_cols = 0;

break;

}

ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);

*dst_mat = ptr_dst_mat;

for (i = 0; i < dst_row; i++) {

ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);

for (j = 0; j < dst_cols; j++) {

ivf64 sum = 0;

kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);

src_i = FIV_MAX(0, i - edge_row);

for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {

ivf64* ptr_src_line_i,*ptr_kernel_line_i;

kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);

src_j = FIV_MAX(0, j - edge_cols);

ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);

ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);

ptr_src_line_i += src_j;

ptr_kernel_line_i += kernel_j;

for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){

sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;

}

}

ptr_dst_line_i[j] = sum;

}

}

}

FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,

0.5,0.6,0.7,0.8,

0.9,1.0,1.1,1.2,

1.3,1.4,1.5,1.6};

void test_conv2()

{

fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix

fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);

fIvMat* dst_mat = NULL;

fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);

fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);

fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);

fIv_release_mat(&src_mat);

fIv_release_mat(&kernel_mat);

fIv_release_mat(&dst_mat);

}

int main()

{

test_conv2();

return 0;

}

10月24日更新:

目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值