制作自己的VOC数据集

       真的是好久没有写些东西了,最近正在搞机器学习,想留下点东西,作为自己这段时间研究的总结,如果能对他人有些帮助就更好了。

        本文主要是制作自己的物体检测的训练集,以VOC数据集举例。

 

        1. 背景

            要制作自己的VOC数据集,首先要先了解VOC数据集的目录结构。其下主要包含以下几个目录:Annotations、ImageSets、JPEGImages、SegmentationClass和SegmentationObject几个目录。我们主要关注的是Annotations、ImageSets和JPEGImages目录。

          Annotations:存放检测物体在图片上的坐标位置

          JPEGImages:存放训练和验证的图片

          ImageSets:文件下有三个子文件夹,Layout、Main和Segmentation,其中我们关注Main文件夹就OK了

       2.步骤

          2.1 :首先将训练用的图片放在JPEGImages文件夹下,图片名称建议命名成0000001.jpg这样的

          2.2 :第二,在Annotations文件夹生成图片的中物体坐标的xml文件,xml文件的名称与图片名称相同。此步建议利用大牛们提供的软件LabelImage,软件的操作方法很简单,这里不介绍了。保存的时候,把xml文件保存到Annotations文件夹中

         3.3 :第三,在漫长的坐标标注之后,就可以生成Main文件夹下的四个文件了(test.txt , train.txt, val.txt ,trainval.txt),这里可以在写相关的脚本来生成,网上也可以搜到。这里我贴一个。

 

import os
import random

trainval_percent = 0.8
train_percent = 0.7
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)

num=len(total_xml)
list=range(num)
tv=int(num*trainval_percent)
tr=int(tv*train_percent)
trainval= random.sample(list,tv)
train=random.sample(trainval,tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
name=total_xml[i][:-4]+'\n'
if i in trainval:
ftrainval.write(name)
if i in train:
ftrain.write(name)
else:
fval.write(name)
else:
ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest .close()

       3:结语

          经过上面几步,就生成自己的VOC数据集,可以进行下一步训练了。

 

  

 

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
遥感数据制作VOC数据集是一种将遥感图像数据转化为VOC数据集格式的过程。VOC数据集是一种常用的目标检测识别数据集格式,适用于训练深度学习模型进行目标检测任务。 首先,需要收集大量的遥感图像数据,可以通过航拍、卫星遥感等方式获取。这些图像数据应涵盖各种地物、场景和目标。 接下来,需要对这些遥感图像进行标注。标注包括两个主要步骤:目标框标注和类别标注。 目标框标注是指在遥感图像中确定目标物体的位置和边界框。可以使用标注工具(如LabelImg)手动框选目标物体,并记录目标框的坐标信息。 类别标注是对每个目标框指定一个类别标签。遥感图像中可能存在多种目标物体,如车辆、建筑物、道路等。针对每个目标框,可以手动选择适当的类别标签(如"car"、"building"、"road"等)。 完成标注后,需要将标注信息转化为VOC数据集格式。VOC数据集格式包括图像文件、标注文件和类别文件。图像文件保留原始的遥感图像,标注文件记录每个目标框的位置和类别信息,类别文件记录所有可能的类别标签。 最后,通过使用相关工具(如LabelImg)对VOC数据集进行校验和修改,确保数据集的质量和准确性。可以检查每个目标框的位置是否正确,并删除不准确或冗余的标注。 通过以上步骤,就能够制作出一份基于遥感数据VOC数据集,可以用于训练目标检测模型,提高遥感图像的自动识别和分析能力,应用于航空、农林、智能交通等领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值