目标检测子区域划分之滑动窗口技术

最新推荐文章于 2024-10-03 17:15:07 发布

争渡！怎渡？

最新推荐文章于 2024-10-03 17:15:07 发布

阅读量2.1k

点赞数 3

分类专栏：毕业设计-基于yoloV3的车牌识别系统文章标签：目标检测之滑动窗口技术

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gdc6916/article/details/111414948

版权

滑动窗口技术是目标检测中的一个重要方法，它将图像分成多个子区域，通过分类器判断是否存在目标。当多个子区域检测到目标时，非极大值抑制算法用于选择最佳边界框。尽管该方法面临计算量大、需预设多种窗口尺寸的挑战，但它是早期目标检测的基础技术。

摘要由CSDN通过智能技术生成

目标检测是一件比较实际的且具有挑战性的计算机视觉任务，其可以看成图像分类与定位的结合，给定一张图片，目标检测系统要能够识别出图片的目标并给出其位置，由于图片中目标数是不定的，且要给出目标的精确位置，目标检测相比分类任务更复杂。

为什么需要滑窗？

目标检测算法通过分类器只能够告诉我们这张图片是否包含待检测目标，但是无法确定其位置（x，y，height，width）。那么怎么去确定待检测物体在图像中的位置呢？我们需要讲图片分成许多个子区域（sub-regions），将这个子区域通过模型检测目标存在情况。如果置信度很高，那么我们有理由相信目标就在这个子区域内，因此可以使用方框标出。那么久衍生出两个问题：

子区域怎么划分

最简单的子区域划分就是滑动窗口技术，采用具有不同长宽比、步长的矩形框来产生子区域。

2. 多个矩形框都通过了分类器检测（选择问题，Which one）

经过滑窗处理检测的结果可能会出现有多个子区域都满足置信度条件。使用非极大值抑值算法选择最终结果。

前提：目标边界框列表及其对应的置信度得分列表，设定阈值，阈值用来删除重叠较大的边界框。

IoU：intersection-over-union，即两个边界框的交集部分除以它们的并集。

非极大值抑制的流程如下：

根据置信度得

最低0.47元/天解锁文章

争渡！怎渡？

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

争渡！怎渡？ CSDN认证博客专家 CSDN认证企业博客

码龄7年

98: 原创

3万+: 周排名

88万+: 总排名

349万+: 访问

: 等级

1万+: 积分

38: 粉丝

142: 获赞

82: 评论

240: 收藏

私信

关注

分类专栏

最新评论

LaneATT 源码解读与复现常见问题总结
兔娃子: 大哥，同求一份源码，十分感谢
LaneATT 源码解读与复现常见问题总结
ベ断桥烟雨ミ554: File "/root/autodl-tmp/LaneATT/lib/datasets/lane_dataset.py", line 275, in __getitem__ line_strings_org = LineStringsOnImage(line_strings_org, shape=img_org.shape) AttributeError: 'NoneType' object has no attribute 'shape' 请问博主如何处理呀？
Failed installing 'Tomcat9' service
QX673: 我的是直接重新装了一遍idea和tomcat，记得把之前的tomcat版本删干净，再重装。
LaneATT 源码解读与复现常见问题总结
TONNYZEE: 想问问那个speed.py.要加载的路径是啥呀，怎么一直报错No such file，我加载了experiment里的config.yaml文件路径了，还是无法加载
Failed installing 'Tomcat9' service
QX673: 你好作者，我在删除tomcat9时，出现报错：失败，拒绝访问怎么办？

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。