从标注好的xml文件中截取坐标点（人脸框四个点坐标）人脸图像并保存在指定文件夹

付付要努力呀

已于 2022-07-25 14:11:40 修改

阅读量1.1k

点赞数 1

分类专栏：活体检测

于 2022-07-25 13:55:49 首次发布

本文链接：https://blog.csdn.net/weixin_45942265/article/details/125973666

版权

xml 人脸截取

活体检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在目标检测中，数据集常常使用labelimg标注，会生成xml文件。本文旨在根据xml标注文件来裁剪目标，以达到去除背景信息的目的。
详细连接：
细节

import cv2
import xml.etree.ElementTree as ET
import os


img_path = r'Y:\V47\Indoor\BWPhoto\Normal\2203181450_Indoor_Normal'  # 图片路径
xml_path = r'Y:\V47\Indoor\BWPhoto\Normal\2203181450_Indoor_Normal'  # 标签路径
obj_img_path = r'D:/cut'  # 目标裁剪图片存放路径

for img_file in os.listdir(img_path):  # 遍历图片文件夹
    if img_file[-4:] in ['.bmp', '.jpg', '.png']:  # 判断文件是否为图片格式
        img_filename = os.path.join(img_path, img_file)  # 将图片路径与图片名进行拼接

        img_cv = cv2.imread(img_filename)  # 读取图片
        img_name = (os.path.splitext(img_file)[0])  # 分割出图片名
        img_name_ = img_name.split('_')[1]


        #找到标签xml文件路径名
        xml_name = xml_path + '\\' + '%s.xml' % ('PADRecord_'+ img_name_)  # 利用标签路径、图片名、xml后缀拼接出完整的标签路径名
        print(xml_name)
        if os.path.exists(xml_name):  # 判断与图片同名的标签是否存在，因为图片不一定每张都打标
            root = ET.parse(xml_name).getroot()  # 利用ET读取xml文件
            count = 0  # 目标框个数统计，防止目标文件覆盖
            for obj in root.iter('LocalizedFaces'):  # 遍历所有目标框
                name = obj.find('LocalizedFace').text  # 获取目标框名称，即label名

                xmlbox = obj.find('LocalizedFace')  # 找到框目标
                x0 = xmlbox.find('JFace').text  # 将框目标的四个顶点坐标取出
                y0 = xmlbox.find('IFace').text
                x1 = xmlbox.find('WidthFace').text
                y1 = xmlbox.find('HeightFace').text
                obj_img = img_cv[int(y0):int(y0)+int(y1), int(x0):int(x0)+int(x1)]  # cv2裁剪出目标框中的图片

                # cv2.imshow("image", obj_img)  # 显示图像
                # cv2.waitKey(0)
                # cv2.destroyAllWindows()

                cv2.imwrite(obj_img_path + '\\' + '%s_%s' % (img_name, count) + '.jpg', obj_img)  # 保存裁剪图片
                count += 1  # 目标框统计值自增1

print("裁剪完成！")