Anchor机制小结：Yolov1~Yolov5

最新推荐文章于 2024-07-10 16:29:18 发布

chairon

最新推荐文章于 2024-07-10 16:29:18 发布

阅读量2.9k

点赞数 3

分类专栏：目标检测文章标签：深度学习机器学习目标检测计算机视觉

本文链接：https://blog.csdn.net/chairon/article/details/124216960

版权

7 篇文章 0 订阅

订阅专栏

就是一个多尺度的滑动窗口，在特征图上的每个cell上生成不同尺寸、不同高宽比的Anchor，也叫先验框
为什么要引入多种比例的Anchor？
物体检测：一些候选区域进行分类和回归的问题。检测目标的大小、形状各不相同

在这里插入图片描述

以YOLOv5为例，利用k-means根据数据集中目标主要分布的长宽尺度聚类出来的一组Anchor。
anchor4个值： x1,y1,x2,y2表矩形左上和右下角点坐标。
聚类生成3种尺度，每组尺度有3种长宽比为：1:1,1:2,2:1 ，共9个Anchor。
跨Anchor预测：每个GroundTruth中心点所在cell和周围4个cell都可以负责预测GroundTruth和这5个cell里的所有Anchor进行匹配，得到K个Anchor （YOLOv5：基于宽高比，其他：IoU）
K个Anchor负责预测这个GT，计算偏移量，生成K个预测框（正样本）

在特征图进行anchor生成，anchor：多尺度、大小固定
生成anchors -> softmax分类器提取positvie anchors -> bbox reg回归positive anchors -> Proposal Layer生成proposals
YOLOv2的Anchor基于RPN提出的
缺点：坐标x,y，w,h的预测是基于整张图片的，可能在左上角的cell产生的预测框跑到了右下角，不行