利用xml格式标签文件批量裁剪出图片中的目标(可以是多目标)

自学之用,只是做简单的测试,为后面数据集做准备。

参考:python利用文件夹下xml格式标签文件批量裁剪出图片中的目标(文件夹、图片名称、目标框数量无限制,逐行注释)_目标检测中根据xml文件对图片的目标区域进行裁剪-CSDN博客

1 、通过标注工具labelImg,将图片目标进行标注,我所标注的目标只有两类,睡觉(sleep)和看手机(phone).

2、批量裁剪代码:(地址:D:\02file\yolov5-master\pic_cj.py)

import cv2
import xml.etree.ElementTree as ET
import os
#将打标后的对像提取出来。
img_path = r'D:\02file\yolov5-master\VOC\2'  # 图片路径
xml_path = r'D:\02file\yolov5-master\VOC\2'  # 标签路径
obj_img_path = r'D:\02file\yolov5-master\VOC\3'  # 目标裁剪图片存放路径

for img_file in os.listdir(img_path):  # 遍历图片文件夹
    if img_file[-4:] in ['.png', '.jpg']:  # 判断文件是否为图片格式
        img_filename = os.path.join(img_path, img_file)  # 将图片路径与图片名进行拼接
        img_cv = cv2.imread(img_filename)  # 读取图片

        img_name = (os.path.splitext(img_file)[0])  # 分割出图片名,如“000.png” 图片名为“000”
        xml_name = xml_path + '\\' + '%s.xml' % img_name  # 利用标签路径、图片名、xml后缀拼接出完整的标签路径名

        if os.path.exists(xml_name):  # 判断与图片同名的标签是否存在,因为图片不一定每张都打标
            root = ET.parse(xml_name).getroot()  # 利用ET读取xml文件
            count = 0  # 目标框个数统计,防止目标文件覆盖
            for obj in root.iter('object'):  # 遍历所有目标框
                name = obj.find('name').text  # 获取目标框名称,即label名

                xmlbox = obj.find('bndbox')  # 找到框目标
                x0 = xmlbox.find('xmin').text  # 将框目标的四个顶点坐标取出
                y0 = xmlbox.find('ymin').text
                x1 = xmlbox.find('xmax').text
                y1 = xmlbox.find('ymax').text

                obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)]  # cv2裁剪出目标框中的图片

                cv2.imwrite(obj_img_path + '\\' + '%s_%s' % (img_name, count) + '.jpg', obj_img)  # 保存裁剪图片
                count += 1  # 目标框统计值自增1

3 裁剪结果

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值