前言
VOC2012目标检测数据集由xml标签文件和图片组成,有时我们想查看原图片中标注了哪些目标信息,需要打开labelImg标注工具查看,一是不方便,另外也看的不是很清楚。本文书写了一个python脚本程序,通过读取xml中box信息,在对应的原图上绘制物体框。
一、引入相关库
# -*- coding: utf-8 -*-
#批量处理img和xml文件,根据xml文件中的坐标把img中的目标标记出来,并保存到指定文件夹,方便自己查看目标标记的是否准确。
import xml.etree.ElementTree as ET
import os, cv2
from tqdm import tqdm
二、程序主干
1.定义文件路径
annota_dir = r'G:\dog_cat_data\10_12data\Annotations' #原始voc格式标签文件存放的文件夹,需改成自己的
origin_dir = r'G:\dog_cat_data\10_12data\JPEGImages' #原始图片文件存放的文件夹,需改成自己的
target_dir1 = r'G:\dog_cat_data\10_12data\plot_img' #绘制完box后的图片存放的文件夹,需改成自己的
2.绘制box
def divide_img(oriname):
img_file = os.path.join(origin_dir, oriname + '.jpg') #需要是jpg格式图片,如果你的是png或者其他格式,需改正
im = cv2.imread(img_file)
xml_file = os.path.join(annota_dir, oriname + '.xml') # 读取每个原图像对应的xml文件
tree = ET.parse(xml_file)
root = tree.getroot()
#im = cv2.imread(imgfile)
for object in root.findall('object'):
object_name = object.find('name').text
Xmin = int(object.find('bndbox').find('xmin').text)
Ymin = int(object.find('bndbox').find('ymin').text)
Xmax = int(object.find('bndbox').find('xmax').text)
Ymax = int(object.find('bndbox').find('ymax').text)
color = (4, 250, 7)
cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
cv2.imshow('01', im)
img_name = oriname + '.jpg' #绘制box后的图片命名
to_name = os.path.join(target_dir1, img_name)
cv2.imwrite(to_name, im)
img_list = os.listdir(origin_dir) #读取所有图片
for name in img_list:
divide_img(name.rstrip('.jpg')) #遍历图片并依次做绘制box的操作
三、完整程序
# -*- coding: utf-8 -*-
#批量处理img和xml文件,根据xml文件中的坐标把img中的目标标记出来,并保存到指定文件夹,方便自己查看目标标记的是否准确。
import xml.etree.ElementTree as ET
import os, cv2
from tqdm import tqdm
annota_dir = r'G:\dog_cat_data\10_12data\Annotations' #原始voc格式标签文件存放的文件夹,需改成自己的
origin_dir = r'G:\dog_cat_data\10_12data\JPEGImages' #原始图片文件存放的文件夹,需改成自己的
target_dir1 = r'G:\dog_cat_data\10_12data\plot_img' #绘制完box后的图片存放的文件夹,需改成自己的
def divide_img(oriname):
img_file = os.path.join(origin_dir, oriname + '.jpg') #需要是jpg格式图片,如果你的是png或者其他格式,需改正
im = cv2.imread(img_file)
xml_file = os.path.join(annota_dir, oriname + '.xml') # 读取每个原图像对应的xml文件
tree = ET.parse(xml_file)
root = tree.getroot()
#im = cv2.imread(imgfile)
for object in root.findall('object'):
object_name = object.find('name').text
Xmin = int(object.find('bndbox').find('xmin').text)
Ymin = int(object.find('bndbox').find('ymin').text)
Xmax = int(object.find('bndbox').find('xmax').text)
Ymax = int(object.find('bndbox').find('ymax').text)
color = (4, 250, 7)
cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
cv2.imshow('01', im)
img_name = oriname + '.jpg' #绘制box后的图片命名
to_name = os.path.join(target_dir1, img_name)
cv2.imwrite(to_name, im)
img_list = os.listdir(origin_dir)
for name in img_list:
divide_img(name.rstrip('.jpg'))
总结
超级好用,效率超级高,学好python,能提高工作效率!觉得还不错的感谢关注收藏,后续还会继续分享好用的数据处理脚本。