数据集制作之txt转xml

问题描述:

  • 现有images图片,txt文件包含四种类别bounding box 坐标,需要将txt中两种类别坐标提取出来并转化成xml文件。
  • images文件夹中有18184张图片,txt文件夹中只有16907个txt文件(即有一千多张图片是没有标注的,需要将这些图片删除)
# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os, sys
import glob
from PIL import Image
# 图像存储位置
src_img_dir = "./1028data/images"
# 图像的 ground truth 的 txt 文件存放位置
src_txt_dir = "./1028data/annotations"
# 生成xml文件存放位置
src_xml_dir = "./1028data/xml"

img_Lists = glob.glob(src_img_dir + '/*.jpg')
img_basenames = []  # e.g. 100.jpg
for item in img_Lists:
    img_basenames.append(os.path.basename(item))
img_names = []  # e.g. 100
for item in img_basenames:
    temp1, temp2 = os.path.splitext(item)
    img_names.append(temp1)

for img in img_names:
    im = Image.open((src_img_dir + '/' + img + '.jpg'))
    width, height = im.size  #xml文件中需要wid
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值