YOLO利用kmeans聚类算法计算anchors box(原理介绍及代码)

1.Kmeans介绍

kmeans聚类属于无监督学习算法,目的是将一组数据分成k组,称之为k个簇,计算出这k组中每组的中心。

从百度图片上找了一张图片,大概就是这样,分成下图中的三组,并且找出每一组的中心。

1

算法思想:

(1)从数据集中随机选取k个点,作为初始化的簇中心

(2)计算每个点到簇中心的距离,并将该点分配到最近的簇中(与那一簇中心的距离最近)

(3)对于2步中重新分配好的簇,重新计算这个簇的中心(大概就是求横纵坐标的均值做为新的中心)

(4)重复2, 3步,直到新计算的簇中心不再变化为止

2.kmeans应用于anchors box计算

     anchors box用于预测bounding box,当anchors box更接近真实的宽高时,模型的性能也就越好。

      kmeans应用在anchors box的计算就是为了计算出更接近真实宽高的k对值。

     与上边的kmeans不同的是不能用欧式几何距离进行分簇,而是采用IOU交并比来作为衡量每队值应该划分进那一簇。

     不知道IOU的看这篇:https://blog.csdn.net/weixin_39025871/article/details/105209726

     IOU可以很好的表示出两对宽高的接近情况,IOU取值为[0,1]之间,IOU越大就表示这两对宽高比越贴近,反之越小表示这两对宽高比差别越远。(放进上边介绍中,就代表,IOU越大,就是两个点离得越近,越小就是两个点离得越远)

     在kmeans里,"距离" 就用 1 - IOU表示,划分时选择值较小的,也就代表了介绍里的距离近。

     算法流程和介绍里的基本类似,就是将距离换成 1-IOU

3.kmeans求解anchors代码:

   代码来源:GitHub - qqwweee/keras-yolo3: A Keras implementation of YOLOv3 (Tensorflow backend)    我加上了一些注释

import numpy as np

class YOLO_Kmeans:

    def __init__(self, cluster_number, filename):
        self.cluster_number = cluster_number
        self.filename = filename

    def iou(self, boxes, clusters):  # 1 box -> k clusters  计算IOU
        n = boxes.shape[0]
        k = self.cluster_number

        box_area = boxes[:, 0] * boxes[:, 1]
        box_area = box_area.repeat(k)
        box_area = np.reshape(box_area, (n, k))

        cluster_area = clusters[:, 0] * clusters[:, 1]
        cluster_area = np.tile(cluster_area, [1, n])
        cluster_area = np.reshape(cluster_area, (n, k))

        box_w_matrix = np.reshape(boxes[:, 0].repeat(k), (n, k))
        cluster_w_matrix = np.reshape(np.tile(clusters[:, 0], (1, n)), (n, k))
        min_w_matrix = np.minimum(cluster_w_matrix, box_w_matrix)

        box_h_matrix = np.reshape(boxes[:, 1].repeat(k), (n, k))
        cluster_h_matrix = np.reshape(np.tile(clusters[:, 1], (1, n)), (n, k))
        min_h_matrix = np.minimum(cluster_h_matrix, box_h_matrix)
        inter_area = np.multiply(min_w_matrix, min_h_matrix)       # 交集

        result = inter_area / (box_area + cluster_area - inter_area)  #交并比IOU
        return result

    def avg_iou(self, boxes, clusters):          #计算 求完anchors后的准确率
        accuracy = np.mean([np.max(self.iou(boxes, clusters), axis=1)])
        return accuracy

    def kmeans(self, boxes, k, dist=np.median):
        box_number = boxes.shape[0]
        distances = np.empty((box_number, k))
        last_nearest = np.zeros((box_number,))
        np.random.seed()
        clusters = boxes[np.random.choice(                    #初始化簇中心,随机选取k个宽高作为簇中心
            box_number, k, replace=False)]  # init k clusters
        while True:
            distances = 1 - self.iou(boxes, clusters)          #距离 用 1-IOU

            current_nearest = np.argmin(distances, axis=1)
            if (last_nearest == current_nearest).all():        #比较本次与上一次的k个簇中心是否变化
                break  # clusters won't change                 #没有变化则停止迭代更新
            for cluster in range(k):
                clusters[cluster] = dist(  # update clusters
                    boxes[current_nearest == cluster], axis=0)

            last_nearest = current_nearest

        return clusters

    def result2txt(self, data):         #将计算结果写进yolo_anchors.txt
        f = open("yolo_anchors.txt", 'w')
        row = np.shape(data)[0]
        for i in range(row):
            if i == 0:
                x_y = "%d,%d" % (data[i][0], data[i][1])
            else:
                x_y = ", %d,%d" % (data[i][0], data[i][1])
            f.write(x_y)
        f.close()

    def txt2boxes(self):               #从训练集文件中读取并计算实际的宽 高
        f = open(self.filename, 'r')
        dataSet = []
        for line in f:
            infos = line.split(" ")
            length = len(infos)
            for i in range(1, length):
                width = int(infos[i].split(",")[2]) - \
                    int(infos[i].split(",")[0])
                height = int(infos[i].split(",")[3]) - \
                    int(infos[i].split(",")[1])
                dataSet.append([width, height])
        result = np.array(dataSet)
        f.close()
        return result

    def txt2clusters(self):                 # 计算 anchors
        all_boxes = self.txt2boxes()        # 加载实际数据 宽高
        result = self.kmeans(all_boxes, k=self.cluster_number)
        result = result[np.lexsort(result.T[0, None])]
        self.result2txt(result)
        print("K anchors:\n {}".format(result))
        print("Accuracy: {:.2f}%".format(
            self.avg_iou(all_boxes, result) * 100))

if __name__ == "__main__":
    cluster_number = 9                  # 分成k组,根据需要自己设定
    filename = "2012_train.txt"         #训练集文件,格式为: 路径 [左上 右下 类别](5个值) ...
    kmeans = YOLO_Kmeans(cluster_number, filename)
    kmeans.txt2clusters()

   

  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
kmeans聚类算法YOLO结合在目标检测中起到了关键作用。YOLO是一种流行的实时目标检测算法,它将图像划分为不重叠的网格,并在每个网格中预测边界框和类别概率。为了提高YOLO的性能,需要事先确定一组适当的anchor box,用于预测不同尺寸和比例的目标框。 kmeans聚类算法被用来生成这些anchor box。在这种应用中,kmeans聚类算法的目标是根据一组训练数据中的目标边界框的特征进行聚类,以找出一组合适的anchor box的中心点。聚类的结果将作为YOLO模型中预测目标边界框的初始值。 通过使用kmeans聚类算法,我们可以根据数据集中目标边界框的特征,自动地确定一组和目标尺寸和比例相对匹配的anchor box。这使得YOLO能够更准确地预测不同大小和形状的目标物体。 总结起来,kmeans聚类算法YOLO的结合能够帮助生成适当的anchor box,提高目标检测的准确性和性能。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [YOLO利用kmeans聚类算法计算anchors box原理介绍代码)](https://blog.csdn.net/weixin_39025871/article/details/105488477)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [YOLO数据集kmeans聚类anchor的算法](https://blog.csdn.net/aosiweixin/article/details/130605146)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值