【学习笔记】目标检测算法(两阶段)

两阶段目标检测算法:

R-CNN:

1.对图像进行Selective Search生成1K~2K个候选区域
2.将每个候选区域输入网络提取特征
3.将特征送入每一类的SVM分类器中,判读是否属于该类
4.使用回归器精细修正候选框的位置
具体的一些细节:
1.利用Selective Search 算法通过图像分割的方法得到一些原始区域。然后使用一些合并策略将这些区域合并,得到一个层次的区域结构,这些结构就包含可能需要的物体。
2.对每个候选区域使用深度网络提取特征
将2000个候选区域缩放到227 * 227,接着将候选区域输入到预先训练好的Alex net获取2000 * 4096维矩阵
3.将特征送入每一类的SVM分类器,判断类别
将20004096维特征与20个SVM组成的权值矩阵409620相乘,获得200020维矩阵,表示每个建议框是每个目标类别的得分。对上述200020维矩阵中的每一列及进行非极大值抑制提出重叠的建议框,得到该列中得分最高的建议框(VOC数据集有20类)

在这里插入图片描述
(算法的缺点:1.测试速度慢,Selective Search算法提取候选框花费大量时间,候选框之间存在大量重叠,提取特征操作冗余。
2.训练速度慢
3.训练所需空间大)

Fast-R-CNN

1.对输入的图像进行Selective Search得到1K~2K个候选区域
2.将

  • 1
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
阶段目标检测算法包括anchor-based算法和anchor-free算法种主要类型。 在anchor-based算法中,目标检测模型会预定义一组锚框(anchors),这些锚框覆盖了不同尺度和长宽比的目标。模型通过计算锚框与真实目标框之间的重叠程度(如IOU),然后根据一定的规则判断锚框是否包含目标。常见的anchor-based算法有two-stage算法和one-stage算法。two-stage算法先通过预测一组候选框,然后再对候选框进行分类和精细化回归;而one-stage算法则直接在每个位置上预测目标类别和位置信息。 在anchor-free算法中,不再依赖于预定义的锚框。相反,模型直接预测目标的位置和类别,通常使用一些特定的方法来生成目标候选框,如CenterNet和CornerNet等。这些算法通过直接回归目标的中心位置或角点位置,实现目标检测。 此外,基于transformer的目标检测算法也是当前的研究热点。这类算法利用transformer模型在图像中提取特征,并通过自注意力机制实现目标检测任务。 总结来说,现阶段目标检测算法主要包括anchor-based算法、anchor-free算法和基于transformer的算法。每种算法都有其独特的优势和适用场景,根据具体需求和任务可以选择合适的算法进行目标检测。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [最新目标检测算法回顾2022笔记](https://blog.csdn.net/qq_41895003/article/details/124933371)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值