目标检测与MMDetection

最新推荐文章于 2024-07-13 16:36:20 发布

qq_34356233

最新推荐文章于 2024-07-13 16:36:20 发布

阅读量97

点赞数

文章标签：目标检测计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34356233/article/details/131118019

版权

来源
- 目标检测与MMDetection_哔哩哔哩_bilibili
定义
- 给定一张图片用矩形框标注出目标并预测出物体类别
应用领域
- 人脸识别
- 智慧城市
- 自动驾驶
技术路线
- 两阶段方法
- 单阶段方法
- Transformer方法

基本概念
- 边界框
- 交并比
- 滑窗
- 感受野
  - 定义：在神经网络中一个神经元能“看到”的原图的区域
  - 中心：一般结论比较复杂
  - 步长：
    - 在某一层中相邻两个神经元的感受野的距离
    - 步长=这一层之前所有stride的乘积

有效感受野（Effective RF）
- 激活值对感受野内的像素求导大小不同
锚框：在原图上设置不同尺寸的基准框
- 生成不同尺寸的预测框
- 在同一位置生成多个提议框覆盖不同物体

难点
- 滑窗的重复计算问题
  - 改进思路：特征图滑窗
    - 用卷积一次性计算所有特征再取出对应位置的特征完成分类

改进思路：在特征图上进行密集预测

预测目标的尺度问题
- 图片中不同预测目标的尺寸可能存在较大差异
- 在高层特征图中经过多次采样位置信息逐层丢失对于小物体的检测能力较弱定位精度较低

密集预测的基本思路
- 边界框回归：让模型同时预测物体类别和预测边界框相对于滑窗的偏移量

基于锚框VS无锚框

非极大值抑制
- 置信度：模型认可自身预测结果的程度
  - 第一种：直接取模型预测物体属于特定类别的概率
  - 第二种：单独预测置信度
- 密集预测模型的训练
  - 检测头在每个位置产生一个预测
  - 该预测值必须与某个真值比较产生损失
  - 但是真值在数据标注中不存在需要基于稀疏的标注框为预测结果产生真值该过程称为匹配
- 密集预测的基本范式

多尺度检测的基本思路
- 图片金字塔：将图片缩放成不同尺寸使算法能在不同图片上检测出不同大小的物体

基于层次化特征：基于主干网络产生的多级特征图产生预测结果
- 劣势：底层特征抽象级别不够预测物体比较困难
- 优势：计算成本低

特征金字塔网络（Feature Pyramid Network）：高层次特征包含足够抽象语义信息将高层特征融入底层特征补充低层特征的语义信息
- 融合方法：特征求和

多尺度密集预测的主流范式

单阶段算法
- 主流方法
  - RPN（Region Proposal Network）
  - YOLO
  - SSD（Single Shot Multibox Detector）
  - RetinaNet
- 问题：正负样本不均衡
  - 预测数量 = 尺度数 x 位置数 x 锚框数
  - 在这些预测中只有少量锚框的真值为正样本大部分锚框的真值为背景

无锚框算法
- 主流方法
  - FCOS（Fully Convolutional One-Stage）
  - CenterNet
- 主流范式

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
目标检测与MMDetection

特征金字塔网络（Feature Pyramid Network）：高层次特征包含足够抽象语义信息将高层特征融入底层特征补充低层特征的语义信息。图片金字塔：将图片缩放成不同尺寸使算法能在不同图片上检测出不同大小的物体。边界框回归：让模型同时预测物体类别和预测边界框相对于滑窗的偏移量。在这些预测中只有少量锚框的真值为正样本大部分锚框的真值为背景。基于层次化特征：基于主干网络产生的多级特征图产生预测结果。定义：在神经网络中一个神经元能“看到”的原图的区域。在某一层中相邻两个神经元的感受野的距离。
复制链接

扫一扫

qq_34356233 CSDN认证博客专家 CSDN认证企业博客

码龄8年

8: 原创

158万+: 周排名

135万+: 总排名

874: 访问

: 等级

80: 积分

4: 粉丝

0: 获赞

5: 评论

0: 收藏

私信

关注

热门文章

最新评论

深度学习预训练与MMPreTrain
CSDN-Ada助手: 恭喜您撰写了这样一篇精彩的博客，涉及的主题也非常有趣。深度学习预训练与MMPreTrain是当前非常热门的话题，您的文章内容非常有价值。我希望您能继续保持这样的创作热情和势头，让我们期待您下一篇博客。同时，我还想提醒您，可以尝试加入更多的实例和案例，以便更好地阐述您的观点和观察结果，这将进一步提升您的文章质量。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
语义分割与MMSegmentation
CSDN-Ada助手: 恭喜您写了第6篇博客，标题为“语义分割与MMSegmentation”。您对语义分割和MMSegmentation的深入探讨令人印象深刻。下一步，建议您可以继续深入探索相关领域，探讨更多的应用和技术细节，期待您的更多优秀文章。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
底层视觉与MMEditing
CSDN-Ada助手: 恭喜您写了第7篇博客，题目看起来很有趣！作为一个读者，我非常欣赏您持续创作的努力和热情。建议您在以后的文章中更深入地探讨底层视觉和MMEditing的相关内容，分享您的经验和见解，也许可以给读者带来更多的启示和帮助。谢谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
MMagic代码课
CSDN-Ada助手: 恭喜你写了第8篇博客，标题看起来很有趣味性。我很高兴看到你持续创作，不断分享你的知识和经验。作为下一步的创作建议，我建议你可以尝试分享一些实用的编程技巧或者深入的编程理论，帮助读者更好地理解编程的本质和实践。期待你的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
OpenMMLab算法框架总体介绍
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。