物体监测:Sliding Window

滑动窗口技术常用于物体检测,通过在不同尺度上滑动,确保能捕获不同大小的目标。然而,这种方法可能导致大量重复计算,增加检测时间,并且难以适应不同场景下物体大小的差异,影响检测精度。多尺度滑动作为改进策略,通过使用不同大小的窗口多次扫描,提高了检测完整性的可能性,但依然面临效率和精度挑战。
摘要由CSDN通过智能技术生成

物体监测:Sliding Window

依次滑动:
每次滑动一个像素点,每个像素都会对应一个框。每次滑动后,都把框框住的内容当作一个图像送入目标检测网络中(如VGG网络,或者ResNet网络)进行检测。检测结果对应的位置,就是框的位置,每次滑动后,位置就确定了。

image

这个固定窗口滑动的方式,会导致截取到的窗口内容可能只是图片中大物体的一部分信息,导致后续的分类准确度较低。 因此可以使用多个尺度的窗口进行滑动截取

多尺度滑动:
就是使用小的框,把整张图滑动一遍之后,再使用大一点的框,再进行滑动一遍。然后再选择更大的框,再进行滑动。最后一个尺度,有可能和整个图的大小差不多。这样才能检测出大的、小的目标

滑动窗口会产生大量的不同大小尺度的图片,造成网络整个检测过程过长。并且,不同的场景,物体的大小差异比较大,很难设计比较合适的滑动窗口大小,去包含各个场景的数据,导致检测的精度比较低。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值