每天五分钟计算机视觉：基于卷积操作完成滑动窗口的图片分类？

幻风_huanfeng

于 2024-04-17 22:36:52 发布

阅读量412

点赞数 3

分类专栏：计算机视觉文章标签：计算机视觉分类人工智能滑动窗口卷积神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huanfeng_AI/article/details/137892303

版权

计算机视觉专栏收录该内容

47 篇文章 7 订阅 ¥19.90 ¥99.00

订阅专栏

本文重点

我们前面学习了使用不同大小的滑动窗口来滑动图片，然后切分成许多小的图片，然后依次应用到我们已经训练好的图像分类模型中，但是这种方式效率太低了，本节课程我们学习一种新的方式，来看一下如何并行识别这些剪切的图片。

原始结构

首先我们先来看一下，如何把神经网络的全连接层转化成卷积层，现在有一个已经训练好的卷积神经网络，前面是卷积层，后面是全连接层。

当输入到该模型一个14*14*3的图片，它的维度是如何变化的？

首先它经过16个5*5*3的过滤器，此时输出变为10*10*16的图片，然后通过参数为2*2的最大池化操作，图像减少到5*5*16，之后连接一个400个单元的全连接神经网络，然后又是一个400单元的全连接神经网络，最后softmax输出y，用 4 个数字来表示，它们分别对应4 个分类出现的概率，这 4 个分类可以是行人、汽车、摩托车和背景或其它对象。

结构变换

现在我们能够使用卷积层来完成全连接神经网络一样的效果吗？也就是说如何把如上所示的卷积神经网络中的全连接层转化为卷积层？

首先这个新的卷积神经网络的卷积层和以前的结构是一样的。而对于第一个全连接层，我们可以用400个 5×5*16 的过滤器来实现，输出维度就是 1×1×400，我们不再把它看作一个含有 400 个节点的集合，而是一个 1×1×400的输出层。从数学角度看，它和全连接层是

了解本专栏

幻风_huanfeng

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
每天五分钟计算机视觉：基于卷积操作完成滑动窗口的图片分类？

当我们有这样的一个卷积神经网络的时候，这样的卷积神经网络就可以认为是14*14的滑动窗口，这样的滑动窗口可以滑动任意大小的图片，最终的输出一定是w*h*4，w，h由原始图片的大小决定，而4表示最后卷积神经网络使用了4个通道，也就是4分类问题。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

幻风_huanfeng 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。