统计xml文件中的标签出现框数及出现过的图片数

在使用SSD-tensorflow训练中需要传入自己的训练集与测试集的一些参数,其中包含各类名出现过的图片数,各类总框数,及总数。

在这里插入图片描述今天写了一个计数的脚本如下,可用于索引XML文件中的目标数:

import re
import os

class_name =['0','1','2','3','4','5','6','7','8','9'] #自己的类名
# './VOC2007/test/Annotations'
annotation_folder = './VOCtest/test/Annotations'		#改为自己xml标签文件夹的路径
list = os.listdir(annotation_folder)
current_number = []#存放类出现的次数
image_count=[]#存放类出现过的图片数
i = 0
while (i < len(class_name)):
	cla = class_name[i]
	total_number=0
	image_num=0
	for j in range(0, len(list)):
		path = os.path.join(annotation_folder,list[j])
		# print(path)
		annotation_file = open(annotation_folder + '/' + os.path.basename(path)).read()
		count = len(re.findall("<name>" + cla + "</name>", annotation_file)) #这里因为我的类名比较简单而且是数字,所以不能单单索引类名,必须把类名前后的符号加上,按自己的需求索引
		if count >0:
			image_num +=1
		total_number += count
	image_count.append(image_num)
	current_number.append(total_number)
	i += 1
#打印格式是按照SSD中格式设置的
for i in range(len(current_number)):
	print('\"%d\" : (' %i,image_count[i],',',current_number[i],'),')
print('\"total\" : (',len(list),',',sum(current_number),'),')

结果如下:
在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小屋*

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值