Yolov3的代码运行流程
Yolov3的代码运行流程如下:
包含准备,训练和测试3个阶段。
1.准备阶段
1.找到划分好的train.txt(里面包含划分好的训练图片编号,包含train和val)。
2.创建txt文件用于记录xml文件的路径和box坐标。
3.导入解析XML文件的包 import xml.etree.ElementTree as ET 属于voc_annotation.py这个文件。
4.打开VOCdevkit下Annotations的xml文件,利用ET遍历每张图片对应的xml文件里的object,
获取box的四个坐标(Xmin,Ymin,Xmax,Ymax),还有类别id(cls_id)。
5.将图片路径还有box的4个坐标和类别id写入之前创建的txt。
6.利用k-means算法生成9个簇的anchor(cluster_number = 9),每个尺寸输出3个anchor
7.具体做法为:
打开之前的生成的txt文件(包含图片路径,图片里box的4个坐标和所属类别id)
通过坐标计算的到每个box的宽和高,利用k-means算法从所有的box集合里随机选取9((cluster_number )个box作为中心点
clusters = boxes[np.random.choice(box_number, k, replace=False)]生成中心簇
用distances = 1 - self.iou(boxes, clusters)来计算每个box离哪个簇最近,获取该簇索引
簇的分类结束之后利用dist=np.median的方式更新簇,再次利用新的中心点进行计算直到中心点不改变为止
返回得到的簇的中心点(anc