【计算机视觉面经四】基于深度学习的目标检测算法面试必备(RCNN~YOLOv5)

本文详细介绍了从两阶段的RCNN、Fast R-CNN、Faster R-CNN,到多阶段的Cascade R-CNN,再到单阶段的YOLO系列目标检测算法。探讨了各种算法的优缺点,如实时性、准确性、多尺度问题和样本不平衡等挑战。
摘要由CSDN通过智能技术生成


在这里插入图片描述

一、前言

目标检测算法主要包括:【两阶段】目标检测算法、【多阶段】目标检测算法、【单阶段】目标检测算法。

什么是两阶段目标检测算法,与单阶段目标检测有什么区别?

两阶段目标检测算法因需要进行两阶段的处理:1)候选区域的获取,2)候选区域分类和回归,也称为基于区域(Region-based)的方。

与单阶段目标检测算法的区别:通过联合解码同时获取候选区域、类别。

什么是多阶段目标检测算法?

【两阶段】和【多阶段】目标检测算法统称级联目标检测算法,【多阶段】目标检测算法通过多次重复进行步骤:1)候选区域的获取,2)候选区域分类和回归,反复修正候选区域。

在这里插入图片描述
根据是否属于锚框分为:

  1. Anchor-Free:
CornerNet
FCOS
TTFNet
YOLOv1(注意)
  1. Anchor-based:
RetinaNet
YOLOv2-v5
PP-YOLO
SSD

主要考虑问题:

  1. 准确性
  2. 实时性
  3. 多尺度
  4. 标签方案
  5. 目标重叠
  6. 模型训练
  7. 重复编码
  8. 数据增强
  9. 样本不平衡

二、两阶段目标检测算法

2.1 RCNN

1、模型通过【选择性搜索算法】获取潜在的候选区域

2、截取原图每个候选区域并resize输入到模型中进行特征抽取

3、使用SVM进行分类,以及进行bounding box 回归

在这里插入图片描述
存在问题:

重复编码:由于候选区域存在重叠,模型需要重复进行重叠区域的特征图提取,计算冗余。

模型训练:由于特征抽取模型和区域的分类回归模型分开训练,无法进行端到端的模型训练,训练过程需要提取每个包含重叠区域的候选区域特征并保存用于分类和回归训练。

实时性差:重复编码导致实时性不佳,【选择性搜索算法】耗时严重。

2.2 Fast-RCNN

考虑到RCNN的缺点,Fast-RCNN来了!

1、模型依旧通过【选择性搜索算法】获取潜在的候选区域。

2、将原图通过特征抽取模型进行一次的共享特征图提取,避免了重复编码。

3、在特征图中找

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值