数据增强-旋转图像+修改标签

该博客主要介绍了如何使用Python进行图像90度旋转,并相应地更新XML注释中的边界框坐标。通过加载图片,应用旋转矩阵并保存旋转后的图像,然后解析和修改XML文件中的尺寸和边界框信息,以适应旋转后的新坐标。此过程对于图像识别和目标检测的数据增强至关重要。
摘要由CSDN通过智能技术生成

数据集xml文件格式

<annotation>
	<folder>cr</folder>
	<filename>crazing_10.jpg</filename>
	<source>
		<database>NEU-DET</database>
	</source>
	<size>
		<width>200</width>
		<height>200</height>
		<depth>1</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>crazing</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>60</xmin>
			<ymin>20</ymin>
			<xmax>194</xmax>
			<ymax>69</ymax>
		</bndbox>
	</object>
	<object>
		<name>crazing</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>9</xmin>
			<ymin>84</ymin>
			<xmax>197</xmax>
			<ymax>198</ymax>
		</bndbox>
	</object>
</annotation>
import numpy as np
import os
import cv2
import xml.etree.ElementTree as ET

imgs_path = './NEU-DET/IMAGES/'
xmls_path = './NEU-DET/ANNOTATIONS/'
img_save_path = './NEU-DET/augemen_image/'
xml_save_path = './NEU-DET/augemen_annotations/'

for images in os.listdir(imgs_path):
    # rotate_img
    oriname = images.rstrip('.jpg')
    img_path = os.path.join(imgs_path, oriname + '.jpg')
    img = cv2.imread(img_path)
    number = oriname.rsplit('_', 1)
    number[1] = 300 + int(number[1])
    H, W, C = img.shape
    # 旋转中心,逆时针旋转90度,最后一个是缩放因子
    M = cv2.getRotationMatrix2D((W/2, H/2), 90, 1)
    dst = cv2.warpAffine(img, M, (W, H))
    cv2.imwrite(img_save_path + number[0] + '_' + str(number[1]) + '.jpg', dst)

    # rotate_xml
    xml_path = os.path.join(xmls_path, oriname + '.xml')
    tree = ET.parse(xml_path)
    root = tree.getroot()
    filename = root.find('filename').text
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for object in root.findall('object'):
        object_name = object.find('name').text
        Xmin = int(object.find('bndbox').find('xmin').text)
        Ymin = int(object.find('bndbox').find('ymin').text)
        Xmax = int(object.find('bndbox').find('xmax').text)
        Ymax = int(object.find('bndbox').find('ymax').text)
        # 修改属性
        w = Xmax - Xmin
        h = Ymax - Ymin
        object.find('bndbox').find('xmin').text = str(Ymin)
        object.find('bndbox').find('ymin').text = str(W - Xmax)
        object.find('bndbox').find('xmax').text = str(Ymax)
        object.find('bndbox').find('ymax').text = str(W - Xmin)
    size.find('width').text = str(H)
    size.find('height').text = str(W)
    root.find('filename').text = number[0] + '_' + str(number[1]) + '.jpg'

    tree.write(xml_save_path + number[0] + '_' + str(number[1]) + '.xml')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值