深度学习之物体检测(二)图像卷积的程序实现

本文介绍了深度学习中物体检测的图像卷积原理,通过图示和矩阵乘法解释了卷积过程。在程序实现中,利用GEMM函数高效地执行卷积计算,将输入数据和卷积核转化为矩阵形式,然后通过矩阵乘法完成卷积,并将结果还原成所需图像大小。对于单通道和多通道输入,分别展示了不同的处理方式。
摘要由CSDN通过智能技术生成

首先用图来说明基本概念:

矩阵乘法的概念理解

在神经网络全连接的使用情况为:

此时,输出为K个神经元,每个神经元有一个输出,后接的全连接层,对每个神经元都有一个系数,又有n个这样的神经元,所以权值矩阵为k*n,输出为1*n维,则保证每个输出神经元都有一个输出。

在神经网络卷积的使用情况为:

输入有Depth维度,则卷积核也应该是depth维度。

图示为卷积的原理,每个卷积核逐个扫过输入数据,累加得到相应的输出。知道卷积计算的原理,但是怎么样在程序中进行高效的执行呢?使用了GEMM函数,通用矩阵乘法函数,把输入数据进行了转化,这里是输入×权值,把输入转化成了行,权值转化成了列,也可以反过来。

把输入数据对应需要做卷积的每一个块,都拉成矩阵的一行,把卷积核都拉成一列,利用矩阵乘法完成卷积计算。然后再按照输出图像的要求,把得到的结果矩阵还原成要求的图像大小。

单通道输入进行如下处理:

此时卷积核也是单通道,直接拉成一个行向量即可。

如果是多通道,首先卷积核按照通道拉成一个一维行向量,三个通道排成一行,对于输入也是按照通道,排成一个大矩阵,如下:

 根据矩阵乘法得到的矩阵还原成输出。

 

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值