物体监测：Sliding Window

最新推荐文章于 2023-03-08 13:57:05 发布

古风子

最新推荐文章于 2023-03-08 13:57:05 发布

阅读量125

点赞数

分类专栏： pytorch实践

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiadongfengyahoo/article/details/115079820

版权

pytorch实践专栏收录该内容

26 篇文章 1 订阅

订阅专栏

滑动窗口技术常用于物体检测，通过在不同尺度上滑动，确保能捕获不同大小的目标。然而，这种方法可能导致大量重复计算，增加检测时间，并且难以适应不同场景下物体大小的差异，影响检测精度。多尺度滑动作为改进策略，通过使用不同大小的窗口多次扫描，提高了检测完整性的可能性，但依然面临效率和精度挑战。

摘要由CSDN通过智能技术生成

物体监测：Sliding Window

依次滑动：
每次滑动一个像素点，每个像素都会对应一个框。每次滑动后，都把框框住的内容当作一个图像送入目标检测网络中（如VGG网络，或者ResNet网络）进行检测。检测结果对应的位置，就是框的位置，每次滑动后，位置就确定了。

这个固定窗口滑动的方式，会导致截取到的窗口内容可能只是图片中大物体的一部分信息，导致后续的分类准确度较低。因此可以使用多个尺度的窗口进行滑动截取

多尺度滑动：
就是使用小的框，把整张图滑动一遍之后，再使用大一点的框，再进行滑动一遍。然后再选择更大的框，再进行滑动。最后一个尺度，有可能和整个图的大小差不多。这样才能检测出大的、小的目标

滑动窗口会产生大量的不同大小尺度的图片，造成网络整个检测过程过长。并且，不同的场景，物体的大小差异比较大，很难设计比较合适的滑动窗口大小，去包含各个场景的数据，导致检测的精度比较低。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。