多目标识别之锚先验计算（先验框）

最新推荐文章于 2024-08-03 01:09:57 发布

才疏学浅的莫笑天

最新推荐文章于 2024-08-03 01:09:57 发布

阅读量1.6k

点赞数 1

分类专栏：深度学习计算机视觉文章标签：聚类算法计算机视觉

本文链接：https://blog.csdn.net/qq_45804132/article/details/118693083

版权

本文介绍了先验框（锚）在多目标识别中的重要性，解释了其原理和作用，特别是在YOLOV2后的广泛应用。先验框是预先设定的不同大小和长宽比的框，有助于目标检测性能提升。获取先验框常用方法包括手动、k-means聚类算法，其中k-means以IoU作为指标，对提升目标检测效果有积极影响。

摘要由CSDN通过智能技术生成

系列文章目录

前言

先验框（与锚）是一个原理，他们主要应用在多目标识别当中，自YOLOV-2系列引入，可以很大程度增加目标检测的性能。直到现在还在广泛应用着。

一. 先验框是什么

简单来说，所谓先验框就是在图像上提前设定好不同大小，不同长宽比的框框。
在这里插入图片描述

如上图所示。先验框的概念也是自YOLOV2之后提出的，因为它大大增强了目标增强的性能，所以后来就被习惯引用了。

我们知道目标识别中，需要学习该目标的类别特征，位置，该目标的大小。而在早期的yolov1中，直接通过全连接层进行边框检测这类操作很难适应于不同物体的形状，这使得多目标识别成为了难题。使用anchor boxes之后，YOLOV2的召回率大大提升，所以在Yolo之后的版本中，均保留了先验框这个方法。

每个先验框内部有若干个参数，分别对应x_offset，y_offset，h&w，置信度，分类结果。解码后，先验框可以辅助处理这些信息。通过这些处理提升目标检测的效果。

二. 先验框讲解

1. 获取先验框

获取先验框一般有三个方法：

手动获取
k-means聚类算法或者改良k-means++
作为超参数学习

第一种在当代无疑是非常愚蠢的，手动标注，在大工作量面前几乎可以直接放弃了。
第二种是是目前流行的方法，k-means作为机器学习最为简单基础的方法之一，它的应用从早期到现在也非常的广。当我们选择交互比iou作为之指标之后，它对先验框的计算表现出还较好的效果。如果想要了解k-means该算法详细原理及python实现，请移步我的博客：
传送门

第三种暂且不谈。

k-means前文已经已经有博客讲解，前文也提过，对于先验框的设计方法其实就是换了个指标的k-means，这个指标就是iou（交并比）

交并比：交集与并集的比值。可形象的表示：如下

在这里插入图片描述
红色为交集

蓝色为并集

交并比就是红色除以蓝色。。。

k-means指标计算如下：

这里的d可以视为普通k-means中的欧氏距离指标，那么很明显交并比越大，则距离越近。

另外我们要注意，在选择先验框的时候，k越多，则平均iou越大，这个推到过程很简单，就不叙述了。同时一般情况下，目标检测效果也会越好，但是相应的计算代价会上升。

三. 代码

'''
锚先验参数计算。
'''
import glob
import xml.etree.ElementTree as ET

import numpy as np


# 计算交并比
def cas_iou(box, cluster):
    x = np.minimum(cluster[:, 0], box[0])
    y = np.minimum(cluster[:, 1], box[1])

    intersection = x * y
    area1 = box[0]