【脚本、数据集操作】同时对原图和mask做同样的裁剪操作（等比例裁剪+指定大小进行滑动窗口裁剪）

本文链接：https://blog.csdn.net/LWD19981223/article/details/127021587

参数说明：

orig_dir：原始图像的文件夹（注意这里的图像都是png格式的，在深度学习中最好采用png格式，可参见博文进行转换：深度学习中图像格式选用jpg还是png？答：png）
mask_dir：原始标签的文件夹（都是png格式的，8bit调色盘模式的图像，关于调色盘的可参见博文：【困惑实验记录】调色盘，即PIL读出的P模式，常用于语义分割标签格式。1）如何固定设置某些index的颜色？2）怎么查看调色盘颜色？3）不设置调色盘颜色的话，是否每次都会转成不同的颜色？）
save_dir：是存放剪裁结果的根目录，每次运行代码就会在里面创建一个子文件夹，子文件夹里面再存放images、mask

import os
from PIL import Image, ImageOps

if __name__ == '__main__':
    orig_dir = r'D:\A_dataset\liao_Upan\orig_labelme_55_png'
    mask_dir = r'D:\A_dataset\liao_Upan\orig_labelme_json(modify)_out_mask\mask'

    save_dir = r'D:\A_dataset\liao_Upan\cutorig'
    # -------------------------------设置存放文件夹-------------------------------- #
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)

    save_len = len(os.listdir(save_dir)) + 1
    images_savedir = os.path.join(save_dir, f'save_{save_len}', 'images')
    mask_savedir = os.path.join(save_dir, f'save_{save_len}', 'mask')

    if not os.path.exists(images_savedir):
        os.makedirs(images_savedir)
    if not os.path.exists(mask_savedir):
        os.makedirs(mask_savedir)
    # ----------------------------------------------------------------------------- #

    # 先resize到原来高宽的1/4的尺寸
    # 然后等比例裁剪为6份（阴差阳错的也成了矩形688*688）、以及滑动剪裁512*512尺寸，当不够的时候就往回剪裁

    filelist = os.listdir(mask_dir)  # 只要有mask，那必然有orig
    for file in filelist:
        filename, _ = os.path.splitext(file)
        file_path = os.path.join(orig_dir, file)  # 都是png格式的

        # --------------------------读取并缩放为原来的1/2----------------------------- #
        image = Image.open(file_path)  # 用PIL打开图像
        image = ImageOps.exif_transpose(image)  # 消除相机的exif信息

        mask_filepath = os.path.join(mask_dir, file)
        mask = Image.open(mask_filepath)
        mask = ImageOps.exif_transpose(mask)  # 消除相机的exif信息

        w, h = image.size
        small_w, small_h = w // 4, h // 4
        small_image = image.resize((small_w, small_h), Image.ANTIALIAS)
        smalll_mask = mask.resize((small_w, small_h), Image.ANTIALIAS)
        # ------------------------------------------------------------------------- #

        # --------------------------等比例裁剪为6份----------------------------------- #
        if small_w > small_h:
            row, col = 2, 3  # 如果宽>高，则裁剪为2行3列
        else:
            row, col = 3, 2

        stride1, stride2 = small_w // col, small_h // row
        for x in range(0, small_w, stride1):
            for y in range(0, small_h, stride2):
                box = (x, y, x + stride1, y + stride2)
                image_crop = small_image.crop(box)
                mask_crop = smalll_mask.crop(box)

                cnt = len(os.listdir(images_savedir)) + 1
                image_crop.save(os.path.join(images_savedir, filename + f'_{cnt}.png'))
                mask_crop.save(os.path.join(mask_savedir, filename + f'_{cnt}.png'))
        # ------------------------------------------------------------------------- #

        # --------------------------滑动剪裁为大小为 512*512的---------------------------- #
        length = 512
        for x in range(0, small_w, length):
            for y in range(0, small_h, length):
                # 用PIL的crop来剪裁，需要box=(xmin, ymin, xmax, ymax)
                tempx = x if x + length < small_w else small_w - length
                tempy = y if y + length < small_h else small_h - length

                box = (tempx, tempy, tempx + length, tempy + length)
                image_crop = small_image.crop(box)
                mask_crop = smalll_mask.crop(box)

                cnt = len(os.listdir(images_savedir)) + 1
                image_crop.save(os.path.join(images_savedir, filename + f'_{cnt}.png'))
                mask_crop.save(os.path.join(mask_savedir, filename + f'_{cnt}.png'))
        print(f'{file} has been processed.')

    print('done.')