在目标检测中,数据集常常使用labelimg标注,会生成xml文件。本文旨在根据xml标注文件来裁剪目标,以达到去除背景信息的目的。
详细连接:
细节
import cv2
import xml.etree.ElementTree as ET
import os
img_path = r'Y:\V47\Indoor\BWPhoto\Normal\2203181450_Indoor_Normal' # 图片路径
xml_path = r'Y:\V47\Indoor\BWPhoto\Normal\2203181450_Indoor_Normal' # 标签路径
obj_img_path = r'D:/cut' # 目标裁剪图片存放路径
for img_file in os.listdir(img_path): # 遍历图片文件夹
if img_file[-4:] in ['.bmp', '.jpg', '.png']: # 判断文件是否为图片格式
img_filename = os.path.join(img_path, img_file) # 将图片路径与图片名进行拼接
img_cv = cv2.imread(img_filename) # 读取图片
img_name = (os.path.splitext(img_file)[0]) # 分割出图片名
img_name_ = img_name.split('_')[1]
#找到标签xml文件路径名
xml_name = xml_path + '\\' + '%s.xml' % ('PADRecord_'+ img_name_) # 利用标签路径、图片名、xml后缀拼接出完整的标签路径名
print(xml_name)
if os.path.exists(xml_name): # 判断与图片同名的标签是否存在,因为图片不一定每张都打标
root = ET.parse(xml_name).getroot() # 利用ET读取xml文件
count = 0 # 目标框个数统计,防止目标文件覆盖
for obj in root.iter('LocalizedFaces'): # 遍历所有目标框
name = obj.find('LocalizedFace').text # 获取目标框名称,即label名
xmlbox = obj.find('LocalizedFace') # 找到框目标
x0 = xmlbox.find('JFace').text # 将框目标的四个顶点坐标取出
y0 = xmlbox.find('IFace').text
x1 = xmlbox.find('WidthFace').text
y1 = xmlbox.find('HeightFace').text
obj_img = img_cv[int(y0):int(y0)+int(y1), int(x0):int(x0)+int(x1)] # cv2裁剪出目标框中的图片
# cv2.imshow("image", obj_img) # 显示图像
# cv2.waitKey(0)
# cv2.destroyAllWindows()
cv2.imwrite(obj_img_path + '\\' + '%s_%s' % (img_name, count) + '.jpg', obj_img) # 保存裁剪图片
count += 1 # 目标框统计值自增1
print("裁剪完成!")