Anchor机制小结:Yolov1~Yolov5

1. Anchor定义

就是一个多尺度的滑动窗口,在特征图上的每个cell上生成不同尺寸、不同高宽比的Anchor,也叫先验框
为什么要引入多种比例的Anchor?
物体检测:一些候选区域进行分类和回归的问题。检测目标的大小、形状各不相同

在这里插入图片描述

2. Anchor工作过程

  • 以YOLOv5为例,利用k-means根据数据集中目标主要分布的长宽尺度聚类出来的一组Anchor。
  • anchor4个值: x1,y1,x2,y2表矩形左上和右下角点坐标。
  • 聚类生成3种尺度,每组尺度有3种长宽比为:1:1,1:2,2:1 ,共9个Anchor。
  • 跨Anchor预测:每个GroundTruth中心点所在cell和周围4个cell都可以负责预测GroundTruth和这5个cell里的所有Anchor进行匹配,得到K个Anchor (YOLOv5:基于宽高比,其他:IoU)
  • K个Anchor负责预测这个GT,计算偏移量,生成K个预测框(正样本)

3. YOLOv1~YOLOv5的Anchor

在这里插入图片描述
参考文献

4.FasterRCNN: RPN网络

  1. 在特征图进行anchor生成,anchor:多尺度、大小固定
  2. 生成anchors -> softmax分类器提取positvie anchors -> bbox reg回归positive anchors -> Proposal Layer生成proposals
  3. YOLOv2的Anchor基于RPN提出的
  4. 缺点:坐标x,y,w,h的预测是基于整张图片的,可能在左上角的cell产生的预测框跑到了右下角,不行
    在这里插入图片描述

5. Anchor存在问题

  1. 超参数难调
  2. 正负样本不均衡
  3. 与GT匹配的过程耗时严重
  4. 对小目标不友好

6.Anchor-Free机制

  1. 基于关键点:
    1. 先检测目标左上角和右下角点
    2. 再通过角点配对以及角点位置的偏移量来输出预测框
  2. 基于中心点
    1. 直接检测物体的中心点和边界偏移量信息
    2. 分类子网、回归子网

在这里插入图片描述

7.基于关键点:CornerNet

  • 沙漏结构:特征提取
  • 角点池化:特征的池化方式,将信息整合到左上角点或者右下角点
  • 预测输出:
    • 预测角点出现的位置 Heatmaps
    • 角点的配对 Embeddings
    • 角点位置的偏移 Offsets
      在这里插入图片描述

在这里插入图片描述

  • 3
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值