csv文件转换xml格式文件

CSV文件格式

image_name,x1,y1,x2,y2,class
db1.jpg,6,1550,145,1704,object
db1.jpg,151,1545,288,1704,object
db1.jpg,291,1552,472,1704,object
db1.jpg,733,1600,863,1704,object
db1.jpg,881,1592,1015,1704,object
db10.jpg,865,592,1043,848,object
db10.jpg,1823,1228,1958,1442,object
db10.jpg,1147,1237,1323,1446,object
db10.jpg,1708,583,1840,832,object

转xml

# .csv-->.xml
# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os, sys
import glob
from PIL import Image
import csv
import os
import numpy as np
import random
import requests

# VEDAI 图像存储位置
src_img_dir = "/home/train/dataset-expand/park_voc/VOC2007/JPEGImages"
# VEDAI 图像的 ground truth 的 txt 文件存放位置
src_txt_dir = "/home/train/dataset-expand/label_expand"
src_xml_dir = "/home/train/dataset-expand/park_voc/VOC2007/Annotations"

img_Lists = glob.glob(src_img_dir + '/*.jpg')

# read csv 1 without width and height
file_path = "WebMarket_coco_gt_object.csv"
with open(file_path) as csvfile:
    csv_reader = csv.reader(csvfile)  # 使用csv.reader读取csvfile中的文件
    birth_header = next(csv_reader)  # 读取第一行每一列的标题
    count = 0
    img_pre = ''
    flag = 0
    for row in csv_reader:  # 将csv 文件中的数据保存到birth_data中
        #print(row)
        #first
        if flag == 0:
            img_pre = row[0].split('.')[0]
            flag = 1
            xml_file = open(('./WebMarket_coco_gt_object/' + img_pre + '.xml'), 'w')
            xml_file.write('<annotation>\n')
            xml_file.write('    <folder>VOC2007</folder>\n')
            xml_file.write('    <filename>' + str(img_pre) + '.jpg' + '</filename>\n')
        img = row[0].split('.')[0]
        # new file
        if img != img_pre:
            # close file
            xml_file.write('</annotation>')
            xml_file.close()
            # new file
            xml_file = open(('./WebMarket_coco_gt_object/' + img + '.xml'), 'w')
            xml_file.write('<annotation>\n')
            xml_file.write('    <folder>VOC2007</folder>\n')
            xml_file.write('    <filename>' + str(img) + '.jpg' + '</filename>\n')
        #print(img)

        '''
        xml_file.write('    <size>\n')
        xml_file.write('        <width>' + str(width) + '</width>\n')
        xml_file.write('        <height>' + str(height) + '</height>\n')
        xml_file.write('        <depth>3</depth>\n')
        xml_file.write('    </size>\n')
        '''


        xml_file.write('    <object>\n')
        xml_file.write('        <name>' + str(row[5]) + '</name>\n')
        xml_file.write('        <pose>Unspecified</pose>\n')
        xml_file.write('        <truncated>0</truncated>\n')
        xml_file.write('        <difficult>0</difficult>\n')
        xml_file.write('        <bndbox>\n')
        xml_file.write('            <xmin>' + str(row[1]) + '</xmin>\n')
        xml_file.write('            <ymin>' + str(row[2]) + '</ymin>\n')
        xml_file.write('            <xmax>' + str(row[3]) + '</xmax>\n')
        xml_file.write('            <ymax>' + str(row[4]) + '</ymax>\n')
        xml_file.write('        </bndbox>\n')
        xml_file.write('    </object>\n')


Python中有多种库可以用来将XML文件转换CSV格式,其中最常用的是`xml.etree.ElementTree`用于解析XML,以及`pandas`用于数据处理和CSV文件操作。 首先,你需要安装这两个库,如果尚未安装,可以使用pip命令: ```bash pip install xml.etree.ElementTree pandas ``` 然后,你可以编写一个脚本来完成这个任务。下面是一个简单的示例,展示了如何读取XML文件,提取所需的数据,并将其保存到CSV文件中: ```python import xml.etree.ElementTree as ET import pandas as pd # 解析XML文件 def parse_xml(xml_file): tree = ET.parse(xml_file) root = tree.getroot() # 创建空列表存储数据 data_list = [] for item in root.findall('.//your_tag_name'): # 根据实际XML结构替换'your_tag_name' row_data = { 'column1': item.attrib.get('attribute1'), # 假设这里有属性attribute1 'column2': item.text, # 假设这里元素有文本内容 # ...添加其他列的处理 } data_list.append(row_data) return data_list # 将数据列表转换为DataFrame并保存为CSV def xml_to_csv(xml_file, csv_file): data = parse_xml(xml_file) df = pd.DataFrame(data) df.to_csv(csv_file, index=False) # 确保索引不被写入CSV # 使用函数 xml_to_csv('input.xml', 'output.csv') ``` 在这个例子中,你需要替换`your_tag_name`、`attribute1`和列名(如`column1`和`column2`)为实际XML文档中的标签名和属性名称。运行上述代码后,XML文件的内容会被转换CSV格式并保存到指定的输出文件中。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值