首先,有关LabelImg这个对图像打标的软件的安装和使用方法可以参考:
https://github.com/tzutalin/labelImg#labelimg
https://blog.csdn.net/enjoy_endless/article/details/80803149
https://cloud.tencent.com/developer/news/325876
本文主要讲解,如何将LabelImg软件标注图片后得到的XML文件,转化为对应的CSV文件数据的代码详解。
一:文件环境说明
首先展示我的操作和代码环境。
(1)在my_test文件夹下,有images文件夹和转换代码xml_to_csv.py
以下my_test文件夹下,就是我们的工作根目录
(2)images文件夹下有test文件夹和train文件夹,分别存在我们的测试图片集和训练图片集
(3)经过LabelImg标注后,得到对应的XML文件,如下所示
二:标注结果分析
以train文件夹下的cam_image1.jpg为例:
对于该图片,我们会使用三个框,分别将两个queen和一个ten标注出来,并写上对应的名称。
于是我们将得到以下XML文件:cam_image1.xml
(若看不清,请点击图片放大后看)
如上图所示,整个XML文件在一个annotation标签中。
整体可以被分为两部分(如两个黑色方框所示)
一个部分:图像的整体信息(第一个黑色方框内)
包括图像的名称,位置,长宽高等信息
第二部分:标注框信息(第二个黑色框内)
每个红色框(即一个object标签)表示一个标注框
包括框内部分图片的类别名称,框的位置信息等
三:XML to CSV
由上图可知,xml内信息是由一个个标签对象组成,且标签之间存在层级关系,如annotation为最上层的标签,其他标签为其子标签。
每一个object标签代表一个标注框,都会在csv文件中生成一条数据,每条数据的属性为:图片文件名,宽度,高度,类别,框的左上角x值,框的左上角y值,框的右上角x值,框的右上角y值
xml_to_csv.py代码如下:(若看不清,请点击图片放大后看)
对应关系:(若看不清,请点击图片放大后看)
四:运行结果
在my_test文件夹下,按shift+鼠标右键,点击‘在此处打开powershell窗口’
输入:python .\xml_to_csv.py
在images文件夹下得到对应的两个csv文件
xml_to_csv.py
import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET
def xml_to_csv(path):
xml_list = []
for xml_file in glob.glob(path + '/*.xml'):
tree = ET.parse(xml_file)
root = tree.getroot()
for member in root.findall('object'):
value = (root.find('filename').text,
int(root.find('size')[0].text),
int(root.find('size')[1].text),
member[0].text,
int(member[4][0].text),
int(member[4][1].text),
int(member[4][2].text),
int(member[4][3].text)
)
xml_list.append(value)
column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
xml_df = pd.DataFrame(xml_list, columns=column_name)
return xml_df
def main():
for folder in ['train','test']:
image_path = os.path.join(os.getcwd(), ('images/' + folder))
xml_df = xml_to_csv(image_path)
xml_df.to_csv(('images/' + folder + '_labels.csv'), index=None)
print('Successfully converted xml to csv.')
main()