MMLAB学习笔记-DAY4

最新推荐文章于 2024-09-15 18:10:00 发布

行吟画者

最新推荐文章于 2024-09-15 18:10:00 发布

阅读量371

点赞数

文章标签：目标检测深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yomik/article/details/128921552

版权

文章探讨了目标检测的基本范式，包括单阶段和两阶段方法，如RCNN系列。两阶段方法中，FastR-CNN引入RoIPooling提高效率，FasterR-CNN则采用RoIAlign。文章还讨论了多尺度检测技术，如特征金字塔网络，以应对不同大小的目标检测问题。

摘要由CSDN通过智能技术生成

目标检测与MMDetection

目标检测

基本范式：单阶段方法->在特征图上基于单点特征实现密集预测；两阶段方法->基于区域，先产生窗口，再对窗口内的特征预测
发展历程

在这里插入图片描述

边界框(bounding box)也叫区域(region)：是紧密包围感兴趣物体的一个框，目标检测任务就是要求我们为目标回归出一个边界框并预测该物体的类别。
区域提议(proposal)：指模型预测出的可能包含目标的框
感兴趣区域(RoI)：对proposal进一步检测是否含有目标时，将该框成为RoI
锚框(Anchor)：预设的框，基于anchor预测边界框
交并比(IoU)：两个矩形框的交集面积比上并集面积

在这里插入图片描述

置信度(confidence)：模型为自己预测的结果打分，一般取置信度较高的结果为预测结果
非极大值预测(NMS)：一般模型会在目标周围密集地预测多个相近但不一样的框，为避免对模型产生不好的影响，只保留置信度最高的那个框
边界框回归：让模型在预测目标类别的同时预测边界框相对于proposal的便宜了

两阶段目标检测算法

RCNN：第一步产生proposal，第二步识别proposal

在这里插入图片描述
缺点：慢，区域提议一般产生2000个框，每个框都要送入CNN中去推理
改进：减少重复计算

Fast R-CNN：与RCNN最大的区别是将proposal处理成固定尺寸之后送入全连接层
处理方法：
RoI Pooling，将不同尺寸的提议框处理成相同尺寸，使之可以送入后续的全连接层计算分类和回归。将proposal切分成7*7的格子；在每个格子内部池化，得到固定尺寸的输出特征图。

在这里插入图片描述
RoI Align：

Faster R-CNN

多尺度检测技术

必要性：因为图像中物体的尺寸有差异，模型在网络的倒数第二层对特征图进行预测，导致其只擅长中等大小的物体，对小目标检测能力较弱。
图像金字塔：让图像缩放到不同大小，生成图像金字塔，使模型不经改变就可适应不同尺度的物体。
层次化特征：基于backbone产生的多级特征图产生预测结果
特征金字塔网络：高层次特征包含足够抽象语义信息。将高层特征融入低层特征，补充低。层特征的语义信息

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

行吟画者 CSDN认证博客专家 CSDN认证企业博客

码龄5年

18: 原创

56万+: 周排名

178万+: 总排名

2万+: 访问

: 等级

509: 积分

7: 粉丝

17: 获赞

16: 评论

44: 收藏

私信

关注

热门文章

分类专栏

大作业 1篇

最新评论

6-3 判断满足条件的三位数 (15 分)
2401_84445483: 如果我想输出范围之内复合的数，我还要加什么啊，大神求解
第2章-8 转换函数使用 (30分)
我们都是路明非: 可以用进制转换函数int()。上面两个评论已经都给出代码了
Python大作业一
LaoYuanPython: 抢到沙发，原创不易，点赞支持！伙计，加油! 最后拉个票，本人正参与博客之星评选，1月24日前每天都可投票，敬请支持！谢谢！投票链接：[code=python] https://bss.csdn.net/m/topic/blog_star2020/detail?username=laoyuanpython [/code] 或到老猿博文首页内的置顶博文跳转！
6-3 判断满足条件的三位数 (15 分)
不许看我～哼: 我还感觉贼迷这玩意为什么会出现到我的递归题目集里……莫得思路
6-3 判断满足条件的三位数 (15 分)
行吟画者:

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。