废话不多说,直接上代码,亲测有效!
from PIL import Image
import os
import shutil
import xml.etree.ElementTree as ET
# 获取输入图片文件夹路径
input_images_folder = input("请输入输入图片文件夹的路径:")
# 获取输入标签文件夹路径
input_labels_folder = input("请输入输入标签文件夹的路径:")
# 获取输出图片文件夹路径
output_images_folder = input("请输入输出图片文件夹的路径:")
# 获取输出标签文件夹路径
output_labels_folder = input("请输入输出标签文件夹的路径:")
# 确保输出图片文件夹存在
if not os.path.exists(output_images_folder):
os.makedirs(output_images_folder)
# 确保输出标签文件夹存在
if not os.path.exists(output_labels_folder):
os.makedirs(output_labels_folder)
# 遍历输入图片文件夹中的所有文件
for filename in os.listdir(input_images_folder):
# 拼接输入图片文件的完整路径
input_image_path = os.path.join(input_images_folder, filename)
# 检查是否为图片文件
if os.path.isfile(input_image_path) and filename.lower().endswith(('.jpg', '.jpeg', '.png')):
# 打开图片文件
image = Image.open(input_image_path)
# 调整图片分辨率为640x640
resized_image = image.resize((640, 640))
# 构造输出图片文件的完整路径
output_image_path = os.path.join(output_images_folder, filename)
# 保存调整分辨率后的图片
resized_image.save(output_image_path)
# 构造对应的标签文件路径
label_filename = os.path.splitext(filename)[0] + ".xml"
input_label_path = os.path.join(input_labels_folder, label_filename)
output_label_path = os.path.join(output_labels_folder, label_filename)
# 如果标签文件存在,则复制并调整其内容
if os.path.isfile(input_label_path):
# 打开输入标签文件
tree = ET.parse(input_label_path)
root = tree.getroot()
# 调整标签文件中的尺寸信息
size = root.find('size')
width = int(size.find('width').text)
height = int(size.find('height').text)
size.find('width').text = '640'
size.find('height').text = '640'
# 调整标签文件中的位置信息
scale_x = 640 / width
scale_y = 640 / height
for obj in root.findall('object'):
bbox = obj.find('bndbox')
xmin = int(bbox.find('xmin').text)
ymin = int(bbox.find('ymin').text)
xmax = int(bbox.find('xmax').text)
ymax = int(bbox.find('ymax').text)
bbox.find('xmin').text = str(int(xmin * scale_x))
bbox.find('ymin').text = str(int(ymin * scale_y))
bbox.find('xmax').text = str(int(xmax * scale_x))
bbox.find('ymax').text = str(int(ymax * scale_y))
# 保存调整后的标签文件
tree.write(output_label_path)
print(f"已处理: {filename}")
print("图片分辨率和标签文件调整完成!")
这个代码是将xml和图片同时缩小到640x640 。