根据voc标签信息在原图上绘制box_根据voc目标检测画框-CSDN博客

本文链接：https://blog.csdn.net/DeepLearning_/article/details/127319098

文章目录

前言
一、引入相关库
二、程序主干
- 1.定义文件路径
- 2.绘制box
三、完整程序
总结

前言

VOC2012目标检测数据集由xml标签文件和图片组成，有时我们想查看原图片中标注了哪些目标信息，需要打开labelImg标注工具查看，一是不方便，另外也看的不是很清楚。本文书写了一个python脚本程序，通过读取xml中box信息，在对应的原图上绘制物体框。

一、引入相关库

# -*- coding: utf-8 -*-
#批量处理img和xml文件，根据xml文件中的坐标把img中的目标标记出来，并保存到指定文件夹，方便自己查看目标标记的是否准确。
import xml.etree.ElementTree as ET
import os, cv2
from tqdm import tqdm

二、程序主干

1.定义文件路径

annota_dir = r'G:\dog_cat_data\10_12data\Annotations'   #原始voc格式标签文件存放的文件夹，需改成自己的
origin_dir = r'G:\dog_cat_data\10_12data\JPEGImages'    #原始图片文件存放的文件夹，需改成自己的
target_dir1 = r'G:\dog_cat_data\10_12data\plot_img'     #绘制完box后的图片存放的文件夹，需改成自己的

2.绘制box

def divide_img(oriname):
    img_file = os.path.join(origin_dir, oriname + '.jpg')   #需要是jpg格式图片，如果你的是png或者其他格式，需改正
    im = cv2.imread(img_file)

    xml_file = os.path.join(annota_dir, oriname + '.xml')  # 读取每个原图像对应的xml文件
    tree = ET.parse(xml_file)
    root = tree.getroot()
#im = cv2.imread(imgfile)
    for object in root.findall('object'):
        object_name = object.find('name').text
        Xmin = int(object.find('bndbox').find('xmin').text)
        Ymin = int(object.find('bndbox').find('ymin').text)
        Xmax = int(object.find('bndbox').find('xmax').text)
        Ymax = int(object.find('bndbox').find('ymax').text)
        color = (4, 250, 7)
        cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
        font = cv2.FONT_HERSHEY_SIMPLEX
        cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
        cv2.imshow('01', im)

    img_name = oriname + '.jpg'  #绘制box后的图片命名
    to_name = os.path.join(target_dir1, img_name)
    cv2.imwrite(to_name, im)

img_list = os.listdir(origin_dir)   #读取所有图片
for name in img_list:
    divide_img(name.rstrip('.jpg'))    #遍历图片并依次做绘制box的操作

三、完整程序

# -*- coding: utf-8 -*-
#批量处理img和xml文件，根据xml文件中的坐标把img中的目标标记出来，并保存到指定文件夹，方便自己查看目标标记的是否准确。
import xml.etree.ElementTree as ET
import os, cv2
from tqdm import tqdm

annota_dir = r'G:\dog_cat_data\10_12data\Annotations'   #原始voc格式标签文件存放的文件夹，需改成自己的
origin_dir = r'G:\dog_cat_data\10_12data\JPEGImages'    #原始图片文件存放的文件夹，需改成自己的
target_dir1 = r'G:\dog_cat_data\10_12data\plot_img'     #绘制完box后的图片存放的文件夹，需改成自己的

def divide_img(oriname):
    img_file = os.path.join(origin_dir, oriname + '.jpg')   #需要是jpg格式图片，如果你的是png或者其他格式，需改正
    im = cv2.imread(img_file)

    xml_file = os.path.join(annota_dir, oriname + '.xml')  # 读取每个原图像对应的xml文件
    tree = ET.parse(xml_file)
    root = tree.getroot()
#im = cv2.imread(imgfile)
    for object in root.findall('object'):
        object_name = object.find('name').text
        Xmin = int(object.find('bndbox').find('xmin').text)
        Ymin = int(object.find('bndbox').find('ymin').text)
        Xmax = int(object.find('bndbox').find('xmax').text)
        Ymax = int(object.find('bndbox').find('ymax').text)
        color = (4, 250, 7)
        cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
        font = cv2.FONT_HERSHEY_SIMPLEX
        cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
        cv2.imshow('01', im)

    img_name = oriname + '.jpg'  #绘制box后的图片命名
    to_name = os.path.join(target_dir1, img_name)
    cv2.imwrite(to_name, im)

img_list = os.listdir(origin_dir)
for name in img_list:
    divide_img(name.rstrip('.jpg'))