数据集的划分是使用yolo网络自主训练智能检测模型的前提步骤,本次将使用以及标注好的数据进行数据划分.之后会教大家如何标注数据
1.数据文件夹的创建
1.1 在yolov5的总文件夹中,有一个data的文件夹,在此文件夹下分别创建如下图两个文件夹,名字可更改为其他,但不要出现中文
1.2 其中一个文件夹中放置所有".xml"后缀的文件,这种文件是以及标注过的图片的信息
1.3 另一个文件夹中放置所有的图片,注意图片的后缀类型是什么样的,如下图所示,我的图片都是png格式的
注意: 标注的文件夹内所有文件的名称和图片文件夹中所有的名称都是一一对应相同的,并且这两个文件夹中的数量也应该相同
2.python文件的更改
2.1 打开data.py文件,在文件开头更改如图所示三个内容依次是:
- xml文件夹所在的目录
- 图片文件夹所在的目录
- 图片标注的名称,如果有多个则分别用逗号隔开写在方括号中
注意:
1.在写路径时,每层路径中的斜杠都应该是右斜杠 / 或者两个左斜杠 \\
如果你的路径是复制出来的,那他一般都是只有一个左斜杠,这种路径是不行的,需要自己更改,如下图所示
2.路径的末尾是你存储标注或图片的文件夹名称,在它之后还应该有一个斜杠 /
2.2 在下方这三个数据表示划分后,训练集,验证集,测试集所占的比值,可以自行更改
2.3 在文件最后,有几个写着".png"的代码,如果你的图片是png格式的不需要更改,如果是其他格式的如 .jpeg 格式 ,则需要将这几个都该成改格式
3.划分效果展示
右键运行此程序即可,运行成功则会出现如下图所示输出,表示每个集的数目
我们打开data文件夹下的这两个文件夹,即可看到划分成三个部分的数据
图片数据集划分效果
标注的数据集划分效果