分配训练和测试数据集(python)——Faster-RCNN

本文介绍了在使用Faster-RCNN时遇到的数据处理问题,包括如何在Python中正确移除文件后缀,避免列表复制时的引用问题,解决列表元素换行的写入问题,以及如何使用'w+'模式创建或覆盖文件。内容还涵盖了如何生成验证集、测试集和训练集的txt文件,并替换原有路径下的Main文件。
摘要由CSDN通过智能技术生成
#!/usr/bin/env python
# vim:set fileencoding=utf-8:
#读取xml文件存入xml_list
#随机读取xml_list的内容,按照比例存储在对应的txt中
#保存txt文件
import os, random
import copy#use copy.deepcopy to copy list
#xml的路径以及分配后的txt存储路径
xml_path = '/home/lys/py-faster-rcnn/data/mydata/image_with_object/Annotations/'
txt_path = '/home/lys/py-faster-rcnn/data/mydata/image_with_object/Main/'

test_percent = 0.2#测试集所占比例
val_percent = 0.2#验证集所占比例
xml_list = os.listdir(xml_path)

#remove the extend .xml
xml_list = [xml.split('.')[0] for xml in xml_list]

xml_len = len(xml_list)
#allot randomly
test = random.sample(xml_list, int(xml_len * test_percent))
trainval = copy.deepcopy(xml_list)
for xml in test:
    trainval.remove(xml)
val = random.sample(trainval, int(len(trainval) * val_percent))
train = copy.deepcopy(trainval)
for xml in val:
    train.remove(xml)

#renew txt and write
trainval_path = open(os.path.joi
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值