浅谈yolov5中的anchor

最新推荐文章于 2025-03-14 17:22:21 发布

寧笙（Lycode）

最新推荐文章于 2025-03-14 17:22:21 发布

阅读量1.5k

点赞数 1

分类专栏：深度学习文章标签： YOLO 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53024882/article/details/133527078

版权

深度学习专栏收录该内容

1 篇文章

订阅专栏

YOLOv5通过预设的锚框适应COCO数据集，但对其他数据集可能不适用。它采用自适应锚框和K-means聚类，根据训练集目标框尺寸动态调整，以提高模型在不同数据集上的检测性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

默认锚框

在这里插入图片描述

YOLOv5的锚框设定是针对COCO数据集中大部分物体来拟定的，其中图像尺寸都是640×640的情况。

anchors参数共3行：

第一行是在最大的特征图上的锚框

第二行是在中间的特征图上的锚框

第三行是在最小的特征图上的锚框

在目标检测中，一般希望在大的特征图上去检测小目标，因此锚框设定较小。一般希望在小的特征图上去检测大目标，因此锚框设定较大。

YOLOv5的作者发现相同类别的目标实例具有相似的gt长宽比，因此从数据集中预先准备几个几率比较大的bounding box，再以它们为基准进行预测。

思考一个问题：我们自己的数据集和COCO数据集中的物体情况相似程度如何呢？默认anchors还能否适应我们的需求呢？

很显然是不能的！

因此YOLOv5中提出了一个自适应锚框的思想，根据目标的特征图上的分布情况自适应地调整锚框的大小和尺度。

思想：传统的目标检测方法通常使用固定大小和尺度的锚框来进行目标检测，但这会导致在处理不同尺度、不同大小的目标时效果不佳。而自适应锚框的思想是在目标检测网络中引入一些机制，使得模型能够根据目标在特征图上的分布自动适应地调整锚框的大小和尺度。

K-means聚类算法

在无标签数据集上执行的最直接任务之一，是在数据集中找到彼此相似的数据组。

K-means存储用于定义聚类的k个质心。如果哪一个点离着哪个质心最接近，则该点被视为位于哪个聚类中。

K-means通过交替进行下面两步来找到最佳质心：

1、根据当前质心将数据点划分到某聚类中

2、根据当前数据点计算聚类的质心

在这里插入图片描述

先初始化k个质心，将各个点划分到现有的簇，然后将所有簇取平均值确定新的质心，迭代之前的操作。

在这里插入图片描述

YOLOv5锚框生成过程：

在YOLOv5模型训练时，默认的做法是它会自动去计算下默认的anchors与你数据集中所有目标的best possible recall，如果小于0.98就会根据你自己数据集的目标去重新聚类生成anchors，反之使用默认的anchors。

具体来说，YOLOv5会首先根据训练集的目标框尺寸信息，选择一个K值，表示聚类的簇数。然后使用K-means或其他聚类算法对目标框的尺寸进行聚类，将相似尺寸的目标框聚到同一个簇中。每个簇的中心点就成为了一个anchor，使用这些重新聚类得到的anchors作为候选框的基准。

通过重新聚类anchor，可以更好地适应当前训练集的目标分布，提高模型的检测性能。但是训练过程中重新聚类anchor是一个耗时的操作。

kmeans_anchor函数：
在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

寧笙（Lycode） 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。