深度学习之物体检测（二）图像卷积的程序实现

最新推荐文章于 2023-02-23 20:31:35 发布

crazyeden

最新推荐文章于 2023-02-23 20:31:35 发布

阅读量632

点赞数

分类专栏：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crazyeden/article/details/83007171

版权

计算机视觉专栏收录该内容

11 篇文章 1 订阅

订阅专栏

本文介绍了深度学习中物体检测的图像卷积原理，通过图示和矩阵乘法解释了卷积过程。在程序实现中，利用GEMM函数高效地执行卷积计算，将输入数据和卷积核转化为矩阵形式，然后通过矩阵乘法完成卷积，并将结果还原成所需图像大小。对于单通道和多通道输入，分别展示了不同的处理方式。

摘要由CSDN通过智能技术生成

首先用图来说明基本概念：

矩阵乘法的概念理解

在神经网络全连接的使用情况为：

此时，输出为K个神经元，每个神经元有一个输出，后接的全连接层，对每个神经元都有一个系数，又有n个这样的神经元，所以权值矩阵为k*n，输出为1*n维，则保证每个输出神经元都有一个输出。

在神经网络卷积的使用情况为：

输入有Depth维度，则卷积核也应该是depth维度。

图示为卷积的原理，每个卷积核逐个扫过输入数据，累加得到相应的输出。知道卷积计算的原理，但是怎么样在程序中进行高效的执行呢？使用了GEMM函数，通用矩阵乘法函数，把输入数据进行了转化，这里是输入×权值，把输入转化成了行，权值转化成了列，也可以反过来。

把输入数据对应需要做卷积的每一个块，都拉成矩阵的一行，把卷积核都拉成一列，利用矩阵乘法完成卷积计算。然后再按照输出图像的要求，把得到的结果矩阵还原成要求的图像大小。

单通道输入进行如下处理：

此时卷积核也是单通道，直接拉成一个行向量即可。

如果是多通道，首先卷积核按照通道拉成一个一维行向量，三个通道排成一行，对于输入也是按照通道，排成一个大矩阵，如下：

根据矩阵乘法得到的矩阵还原成输出。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。