划分数据集2,详细说明

看完了这个之后划分数据集,训练自己的数据集。-CSDN博客

我再详细说一下自己标注的文件放在什么位置

我发的文件里有这几个文件

在dataset里面有

自己的数据集分为,图片部分和标注文件部分

打开VOCdevkit文件夹

里面有三个文件夹

自己的图片的话,放在JPEGImages

标注的文件:如果是xml格式的话,放在Annotations里,如果是txt格式的话,放在txt里,

我说明一下,比如我有100张图,我对这些图片进行标注了,那么对应的标注文件数量也应该是100个的,大家检查一下,看看自己有没有漏标的之类的东西。

这些文件放在对应的文件夹之后,就可以开始划分了

举个例子

现在我已经把我的图片放在了JPEGImages文件夹里面

如果我的标注文件格式是xml的话,我把标注文件放在Annotations里面

看一下自己图片的格式,去设置xml2txt.py里的参数

看看自己的图片是说明格式的,选择对应的格式

按住shift+鼠标右键点dataset文件夹,选择在终端中打开

这是进入当前文件位置的终端里了,

激活自己的环境        conda activate 自己的环境名字

输入

python xml2txt.py

这时候就是程序在运行了

最下面的一行会出现  

大括号里面的几个就是标注文件里面的类别名称

打开data.yaml

把这几个复制进来

nc后面填的是类别个数,看这里显示了4个名字,我这就填4

接着就是划分数据集了,打开split_data.py

val_sie = 0.1 的意思是验证集占比10%

同理test_size = 0.1就是测试集占比10%

剩余的就是训练集了,就是80%

这里一般都是设置8:1:1

还有就是图片格式了,填自己图片的格式

接着就和刚才操作一样,进入当前文件位置的终端后,进入自己的环境

输入

python split_data.py

 

运行完成后就会显示

你会发现dataset文件夹里多了两个文件夹,

这就是对应划分的数据集了

如果你的标注格式是txt的话,就和刚才的第二步一样,你划分的类别和数量填在data.yaml文件里就可以了

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值