Python 统计数据集标签的类别及数目

最新推荐文章于 2024-01-31 11:13:43 发布

_一点点_

最新推荐文章于 2024-01-31 11:13:43 发布

阅读量1w

点赞数 7

分类专栏： Python基本操作深度学习文章标签： Python 数据集

本文链接：https://blog.csdn.net/weixin_41991401/article/details/89517903

版权

本文介绍了如何使用Python对个人标注的数据集进行类别和数量的统计，借鉴了大神在处理VOC数据集时的方法。

摘要由CSDN通过智能技术生成

看了大神统计voc数据集标签框后，针对自己标注数据集，灵活应用，感谢

import re
import os
import xml.etree.ElementTree as ET
class1 = 'answer'
class2 = 'hand'
class3 = 'write'
class4 = 'music'
class5 = 'phone'
'''class6 = 'bus'
class7 = 'car'
class8 = 'cat'
class9 = 'chair'
class10 = 'cow'
class11 = 'diningtable'
class12 = 'dog'
class13 = 'horse'
class14 = 'motorbike'
class15 = 'person'
class16 = 'pottedplant'
class17 = 'sheep'
class18 = 'sofa'
class19 = 'train'
class20 = 'tvmonitor'
'''
annotation_folder = '/home/.../train/'		#改为自己标签文件夹的路径
#annotation_folder = '/home/.../VOC2007/Annotations/'
list = os.listdir(annotation_folder)


def file_name(file_dir):
	L = []
	for root, dirs, files in os.walk(file_dir):
		for file in files:
			if os.path.splitext(file)[1] == '.xml':
				L.append(os.path.join(root, file))
	return L


total_number1 = 0
total_number2 = 0
total_number3 = 0
total_number4 = 0
total_number5 = 0
'''total_number6 = 0
total_number7 = 0
total_number8 = 0
total_number9 = 0
total_number10 = 0
total_number11 = 0
total_number12 = 0
total_number13 = 0
total_number14 = 0
total_