VisDrone2019-DET数据集转yolo格式

VisDrone2019-DET数据集为无人机视觉数据集
内部图片为行人与车辆的合集,内部有不少拍摄模糊的照片
对内部文件进行查看,很多小型行人也做了标注,看着密密麻麻的,估计对后续训练应该增加不少难度
大部分数据标注还是比较准确的,有个别行人有漏标注的情况

因为使用中主要是yolo方面的训练,所以对其数据进行转换,另外使用中只需要其带有行人标注的数据集,所以使用代码进行统一处理和筛选,新建train文件夹,拷贝下面代码为py文件后运行(保留第二类和第三类,然后统一更改为自己使用的第一类)

import os
from pathlib import Path
from PIL import Image
import csv
import shutil

def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[2] / 2) * dw
    y = (box[1] + box[3] / 2) * dh
    w = box[2] * dw
    h = box[3] * dh
    return (x, y, w, h)
            
wd = os.getcwd()

anns = os.listdir('annotations')
for ann in anns:
    ans = ''
    outpath = wd + '/train/' + ann
    if ann[-3:] != 'txt':
        continue
    with Image.open(wd + '/images/' + ann[:-3] + 'jpg') as Img:
        img_size = Img.size
    with open(wd + '/Annotations/' + ann, newline='') as csvfile:
        spamreader = csv.reader(csvfile)
        for row in spamreader:
            if row[4] == '0':
                continue
            if row[5] == '1' or row[5] =='2':
            print(row[0],row[1],row[2],row[3],row[4],row[5])
            bb = convert(img_size, tuple(map(int, row[:4])))
            ans = ans + '1' + ' ' + ' '.join(str(a) for a in bb) + '\n'
            with open(outpath, 'w') as outfile:
                outfile.write(ans)
            shutil.copy(wd + '/images/' + ann[:-3] + 'jpg',wd + '/train/' + ann[:-3] + 'jpg')

操作完成之后,发现有很多图像文件里只有很少的行人标注,而且都是很小的地方,这个还真是难为提供数据集的大拿,很多行人不仔细找都找不到,他们都标出了,不过由于标注太小,训练难度太大,对不清晰,太少标注的train内图片进行删除,然后对数据集进行清理,建立train1文件夹,代码如下

import os
from pathlib import Path
from PIL import Image
import csv
import shutil
       
wd = os.getcwd()

anns = os.listdir('train')
for ann in anns:
    if ann[-3:] != 'jpg':
        continue
    shutil.copy(wd + '/train/' + ann[:-3] + 'jpg',wd + '/train1/' + ann[:-3] + 'jpg')
    shutil.copy(wd + '/train/' + ann[:-3] + 'txt',wd + '/train1/' + ann[:-3] + 'txt')
### 回答1: VisDrone2019-Det数据集是一个用于目标检测的数据集,包含来自无人机和地面监控摄像头的视频序列,用于人、车和其他物体的检测和识别。该数据集包含230,000个图像,其中包含827,000个物体实例,这些物体在尺寸、姿态、遮挡和密度方面具有多样性。对于每个图像,数据集都提供了一个XML注释文件和一个JPEG图像文件。 XML注释文件包含了对象的位置、类别、形状和尺寸信息。它由根元素和一系列对象节点组成。根元素包含图像的大小和名称信息,对象节点包含每个检测到的物体的信息。每个对象节点包含一个类别节点和一个边界框节点。类别节点表示该物体的类别,边界框节点描述了该物体在图像中的位置和大小。 JPEG图像文件是以RGB格式保存的,包含所检测到的目标物体的图像信息。它们被存储在单独的文件夹中,文件夹名称对应于注释文件的名称。 VisDrone2019-Det数据集格式是符合POD(Portable Object Description)规范的,这使得它可以在不同的目标检测框架中使用,并且可以轻松添加和删除对象类别和其他属性。这种数据集格式的好处是提供了标准化的注释格式,使得数据集的使用更加方便和灵活。 ### 回答2: visdrone2019-det数据集格式是一个文本文件,其中包含了所有检测目标的信息。它是通过对无人机拍摄的视频进行标注来生成的。每个文本文件中包含了一张图片中所有检测目标的信息,每个目标的信息由若干行构成,每一行表示一个目标的一个属性。该数据集包括了以下属性: 1. 目标类别:表示该目标所属的类别,如行人、自行车、汽车等。 2. 目标位置:表示目标框的左上角坐标与右下角坐标,分别用x1,y1,x2,y2表示,单位是像素。 3. 目标遮挡度:表示目标被遮挡的程度,范围是0-4,其中0表示完全可见,4表示完全遮挡。 4. 目标检测得分:表示算法检测到该目标的置信度得分。 5. 其他属性:可能还包括目标方向、目标速度等信息。 一般来说,对于一个检测目标,在文本文件中会按照上述顺序依次写入其属性信息。由于visdrone2019-det数据集是基于文本格式存储,因此需要借助特定的算法或工具对其进行解析之后才能进行数据处理和训练模型等操作。 ### 回答3: VisDrone2019-Det数据集是一个目标检测数据集,收集了来自中国不同城市的高空视频图像,共包括6,471张图像和932,235个物体实例。该数据集格式如下: 1.数据集的文件组织结构 数据集文件夹包含三个子文件夹annotations、images、ImageSets,其中: annotations文件夹包含若干个JSON格式的标注文件,每个标注文件对应一张图像的目标检测标注信息。 images文件夹包含所有的原始图像。 ImageSets文件夹包含若干个txt格式的文件,用于制作训练集、验证集和测试集。 2.标注文件的格式 每个标注文件包含该图像中所有目标的信息,每个目标都包括以下信息: 目标类别:如行人、车辆、非机动车等。 目标边界框:左上角坐标(x_min,y_min)和右下角坐标(x_max,y_max)。 目标难易程度:分为1、2、3三个等级,分别代表难、中、易。 目标可见性:分为1、2、3、4四个等级,表示该目标在图像中的可见度。 3.训练集、验证集和测试集的制作 使用ImageSets文件夹中的txt格式的文件,可以很方便地划分训练集、验证集和测试集。每个文件包含图像的名称,以及该图像被用于训练、验证或测试。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wukongxuetang

如果文章对你的工作有帮助就鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值