滑动窗口算法_目标检测进阶一(窗口滑动卷积算法)

本文介绍了如何使用滑动窗口和卷积网络进行目标检测,特别是针对汽车检测的应用。通过训练卷积网络,使用不同大小的窗口滑过图像,判断每个位置是否存在目标对象。为降低计算成本,将全连接层转换为卷积层,提高运算效率,但可能会导致边界框定位不精确。
摘要由CSDN通过智能技术生成

f0b6a407c87db569e91ee13aaf1f43c2.png

神经网络可以通过输出图片上特征点的(x,y)坐标来实现对目标特征的识别。

06f5e7efaa2d55210cd9cdd04c174fd9.png

假设你正在构建一个人脸识别应用,出于某种原因,你希望算法可以给出眼角的具体位置。眼角坐标为(x,y),你可以让神经网络的最后一层多输出两个数字lx和ly,作为眼角的坐标值。如果你想知道两只眼睛的四个眼角的具体位置,那么从左到右,依次用四个特征点来表示这四个眼角。对神经网络稍作一些修改,输出第一个特征点(l1x,l1y),第二个特征点(l2x,l2y)依此类推,这四个脸部特征的位置就可以通过神经网络输出。还可以通过嘴的坐标来确定嘴的形状从而判断人物是在微笑还是皱眉。我们以此来引申出如何通过卷积网络进行对象目标检测(基于滑动窗口的目标检测算法)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值