visdrone2019/2020数据集txt标签文件转xml

亲测可用。

visdrone2019/2020数据集txt标签文件转xml

txt标签内容为:
bbox_left,bbox_top,bbox_width,bbox_height,score,object_category,truncation,occlusion
类别: ignored regions(0), pedestrian(1), people(2), bicycle(3), car(4),van(5), truck(6), tricycle(7), awning-tricycle(8), bus(9), motor(10),
others(11)

import cv2
import os
import numpy as np


input_img_folder = 'images'
input_ann_folder = 'annotations'
output_ann_folder = 'annotations_xml'
output_img_folder = 'images_new'

os.makedirs(output_img_folder, exist_ok=True)
os.makedirs(output_ann_folder, exist_ok=True)


image_list = os.listdir(input_img_folder)
annotation_list = os.listdir(input_ann_folder)

label_dict = {
	"0" : "Ignore",
	"1" : "Pedestrian",
	"2" : "People",
	"3" : "Bicycle",
	"4" : "Car",
	"5" : "Van",
	"6" : "Truck",
	"7" : "Tricycle",
	"8" : "Awning-tricycle",
	"9" : "Bus",
	"10" : "Motor",
	"11" : "Others"
}

thickness = 2
color = (255,0,0)
count = 0

def object_string(label, bbox):
	req_str = '''
	<object>
		<name>{}</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>{}</xmin>
			<ymin>{}</ymin>
			<xmax>{}</xmax>
			<ymax>{}</ymax>
		</bndbox>
	</object>
	'''.format(label, bbox[0], bbox[1], bbox[2], bbox[3])
	return req_str

for annotation in annotation_list:
	annotation_path = os.path.join(os.getcwd(), input_ann_folder, annotation)
	xml_annotation = annotation.split('.txt')[0] + '.xml'
	xml_path = os.path.join(os.getcwd(), output_ann_folder, xml_annotation)
	img_file = annotation.split('.txt')[0] + '.jpg'
	img_path = os.path.join(os.getcwd(), input_img_folder, img_file)
	print(img_path)
	output_img_path = os.path.join(os.getcwd(), output_img_folder, img_file)
	img = cv2.imread(img_path)

	annotation_string_init = '''
<annotation>
	<folder>annotations</folder>
	<filename>{}</filename>
	<path>{}</path>
	<source>
		<database>Unknown</database>
	</source>
	<size>
		<width>{}</width>
		<height>{}</height>
		<depth>{}</depth>
	</size>
	<segmented>0</segmented>'''.format(img_file, img_path, img.shape[1], img.shape[0], img.shape[2])  # numpy图片顺序 高、宽、通道
	print(img.shape[0])
	file = open(annotation_path, 'r')
	lines = file.readlines()
	for line in lines:
		new_line = line.strip('\n').split(',')
		new_coords_min = (int(new_line[0]), int(new_line[1]))
		new_coords_max = (int(new_line[0])+int(new_line[2]), int(new_line[1])+int(new_line[3]))
		bbox = (int(new_line[0]), int(new_line[1]), int(new_line[0])+int(new_line[2]), int(new_line[1])+int(new_line[3]))
		label = label_dict.get(new_line[5])
		req_str = object_string(label, bbox)
		annotation_string_init = annotation_string_init + req_str
		#cv2.rectangle(img, new_coords_min, new_coords_max, color, thickness)

	# cv2.imwrite(output_img_path, img)

	annotation_string_final = annotation_string_init + '</annotation>'
	f = open(xml_path, 'w')
	f.write(annotation_string_final)
	f.close()
	count += 1
	print('[INFO] Completed {} image(s) and annotation(s) pair'.format(count))

也可完成xml文件内path路径的修改

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: VisDrone2019-Det数据集是一个用于目标检测的数据集,包含来自无人机和地面监控摄像头的视频序列,用于人、车和其他物体的检测和识别。该数据集包含230,000个图像,其中包含827,000个物体实例,这些物体在尺寸、姿态、遮挡和密度方面具有多样性。对于每个图像,数据集都提供了一个XML注释文件和一个JPEG图像文件XML注释文件包含了对象的位置、类别、形状和尺寸信息。它由根元素和一系列对象节点组成。根元素包含图像的大小和名称信息,对象节点包含每个检测到的物体的信息。每个对象节点包含一个类别节点和一个边界框节点。类别节点表示该物体的类别,边界框节点描述了该物体在图像中的位置和大小。 JPEG图像文件是以RGB格式保存的,包含所检测到的目标物体的图像信息。它们被存储在单独的文件夹中,文件夹名称对应于注释文件的名称。 VisDrone2019-Det数据集的格式是符合POD(Portable Object Description)规范的,这使得它可以在不同的目标检测框架中使用,并且可以轻松添加和删除对象类别和其他属性。这种数据集格式的好处是提供了标准化的注释格式,使得数据集的使用更加方便和灵活。 ### 回答2: visdrone2019-det数据集格式是一个文本文件,其中包含了所有检测目标的信息。它是通过对无人机拍摄的视频进行标注来生成的。每个文本文件中包含了一张图片中所有检测目标的信息,每个目标的信息由若干行构成,每一行表示一个目标的一个属性。该数据集包括了以下属性: 1. 目标类别:表示该目标所属的类别,如行人、自行车、汽车等。 2. 目标位置:表示目标框的左上角坐标与右下角坐标,分别用x1,y1,x2,y2表示,单位是像素。 3. 目标遮挡度:表示目标被遮挡的程度,范围是0-4,其中0表示完全可见,4表示完全遮挡。 4. 目标检测得分:表示算法检测到该目标的置信度得分。 5. 其他属性:可能还包括目标方向、目标速度等信息。 一般来说,对于一个检测目标,在文本文件中会按照上述顺序依次写入其属性信息。由于visdrone2019-det数据集是基于文本格式存储,因此需要借助特定的算法或工具对其进行解析之后才能进行数据处理和训练模型等操作。 ### 回答3: VisDrone2019-Det数据集是一个目标检测数据集,收集了来自中国不同城市的高空视频图像,共包括6,471张图像和932,235个物体实例。该数据集的格式如下: 1.数据集文件组织结构 数据集文件夹包含三个子文件夹annotations、images、ImageSets,其中: annotations文件夹包含若干个JSON格式的标注文件,每个标注文件对应一张图像的目标检测标注信息。 images文件夹包含所有的原始图像。 ImageSets文件夹包含若干个txt格式的文件,用于制作训练集、验证集和测试集。 2.标注文件的格式 每个标注文件包含该图像中所有目标的信息,每个目标都包括以下信息: 目标类别:如行人、车辆、非机动车等。 目标边界框:左上角坐标(x_min,y_min)和右下角坐标(x_max,y_max)。 目标难易程度:分为1、2、3三个等级,分别代表难、中、易。 目标可见性:分为1、2、3、4四个等级,表示该目标在图像中的可见度。 3.训练集、验证集和测试集的制作 使用ImageSets文件夹中的txt格式的文件,可以很方便地划分训练集、验证集和测试集。每个文件包含图像的名称,以及该图像被用于训练、验证或测试。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值