将LabelImg得到的XML文件转为CSV文件

最新推荐文章于 2024-04-30 10:29:24 发布

STILLxjy

最新推荐文章于 2024-04-30 10:29:24 发布

阅读量2.6k

点赞数 10

分类专栏： ——机器学习—— 深度学习 TensorFlow Python

本文链接：https://blog.csdn.net/STILLxjy/article/details/95234150

版权

——机器学习—— 同时被 3 个专栏收录

30 篇文章 3 订阅

订阅专栏

深度学习

13 篇文章 0 订阅

订阅专栏

TensorFlow

10 篇文章 0 订阅

订阅专栏

首先，有关LabelImg这个对图像打标的软件的安装和使用方法可以参考：
https://github.com/tzutalin/labelImg#labelimg
https://blog.csdn.net/enjoy_endless/article/details/80803149
https://cloud.tencent.com/developer/news/325876

本文主要讲解，如何将LabelImg软件标注图片后得到的XML文件，转化为对应的CSV文件数据的代码详解。

一：文件环境说明
首先展示我的操作和代码环境。
（1）在my_test文件夹下，有images文件夹和转换代码xml_to_csv.py
以下my_test文件夹下，就是我们的工作根目录
在这里插入图片描述
（2）images文件夹下有test文件夹和train文件夹，分别存在我们的测试图片集和训练图片集
（3）经过LabelImg标注后，得到对应的XML文件，如下所示

二：标注结果分析
以train文件夹下的cam_image1.jpg为例：
在这里插入图片描述
对于该图片，我们会使用三个框，分别将两个queen和一个ten标注出来，并写上对应的名称。
于是我们将得到以下XML文件：cam_image1.xml
(若看不清，请点击图片放大后看)

如上图所示，整个XML文件在一个annotation标签中。
整体可以被分为两部分（如两个黑色方框所示）

一个部分：图像的整体信息（第一个黑色方框内）
包括图像的名称，位置，长宽高等信息

第二部分：标注框信息（第二个黑色框内）
每个红色框（即一个object标签）表示一个标注框
包括框内部分图片的类别名称，框的位置信息等

三：XML to CSV
由上图可知，xml内信息是由一个个标签对象组成，且标签之间存在层级关系，如annotation为最上层的标签，其他标签为其子标签。

每一个object标签代表一个标注框，都会在csv文件中生成一条数据，每条数据的属性为：图片文件名，宽度，高度，类别，框的左上角x值，框的左上角y值，框的右上角x值，框的右上角y值

xml_to_csv.py代码如下：(若看不清，请点击图片放大后看)
在这里插入图片描述
对应关系：(若看不清，请点击图片放大后看)

四：运行结果
在my_test文件夹下，按shift+鼠标右键，点击‘在此处打开powershell窗口’
输入：python .\xml_to_csv.py

在images文件夹下得到对应的两个csv文件
在这里插入图片描述

xml_to_csv.py

import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET


def xml_to_csv(path):
    xml_list = []
    for xml_file in glob.glob(path + '/*.xml'):
        tree = ET.parse(xml_file)
        root = tree.getroot()
        for member in root.findall('object'):
            value = (root.find('filename').text,
                     int(root.find('size')[0].text),
                     int(root.find('size')[1].text),
                     member[0].text,
                     int(member[4][0].text),
                     int(member[4][1].text),
                     int(member[4][2].text),
                     int(member[4][3].text)
                     )
            xml_list.append(value)
    column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
    xml_df = pd.DataFrame(xml_list, columns=column_name)
    return xml_df


def main():
    for folder in ['train','test']:
        image_path = os.path.join(os.getcwd(), ('images/' + folder))
        xml_df = xml_to_csv(image_path)
        xml_df.to_csv(('images/' + folder + '_labels.csv'), index=None)
        print('Successfully converted xml to csv.')


main()

STILLxjy

关注

10
点赞
踩
26

收藏

觉得还不错? 一键收藏
7
评论
将LabelImg得到的XML文件转为CSV文件

首先，有关LabelImg这个对图像打标的软件的安装和使用方法可以参考：https://github.com/tzutalin/labelImg#labelimghttps://blog.csdn.net/enjoy_endless/article/details/80803149https://cloud.tencent.com/developer/news/325876本文主要讲解，如...
复制链接

扫一扫