如有错误,恳请指出。
在使用yolov5训练自己的数据集时,一般需要对数据集进行处理。数据集一般的标注文件为xml格式,所以首先将这种xml格式的标注文件转换为yolo的txt标注文件,然后将再设置成yolov5所需要的目录层次。这里我直接根据图片文件与所处理好的txt目录文件直接生成dataset,这里的dataset满足yolov5所需要的目录层次。
1. 将xml格式的数据转换为yolo格式
由于voc对数据集的标注格式是xml文件的,标注信息清楚;而对于yolo的标注格式是txt文件的,由目标类别和标注框的相对位置来组成:
# voc的xml文件内容,以2007_000027.xml为例(省略部分内容):
<annotation>
<folder>VOC2012<