参数说明:
orig_dir
:原始图像的文件夹(注意这里的图像都是png
格式的,在深度学习中最好采用png
格式,可参见博文进行转换:深度学习中图像格式选用jpg还是png?答:png)mask_dir
:原始标签的文件夹(都是png
格式的,8bit调色盘模式的图像,关于调色盘的可参见博文:【困惑实验记录】调色盘,即PIL读出的P模式,常用于语义分割标签格式。1)如何固定设置某些index的颜色?2)怎么查看调色盘颜色?3)不设置调色盘颜色的话,是否每次都会转成不同的颜色?)save_dir
:是存放剪裁结果的根目录,每次运行代码就会在里面创建一个子文件夹,子文件夹里面再存放images
、mask
import os
from PIL import Image, ImageOps
if __name__ == '__main__':
orig_dir = r'D:\A_dataset\liao_Upan\orig_labelme_55_png'
mask_dir = r'D:\A_dataset\liao_Upan\orig_labelme_json(modify)_out_mask\mask'
save_dir = r'D:\A_dataset\liao_Upan\cutorig'
# -------------------------------设置存放文件夹-------------------------------- #
if not os.path.exists(save_dir):
os.makedirs(save_dir)
save_len = len(os.listdir(save_dir)) + 1
images_savedir = os.path.join(save_dir, f'save_{save_len}', 'images')
mask_savedir = os.path.join(save_dir, f'save_{save_len}', 'mask')
if not os.path.exists(images_savedir):
os.makedirs(images_savedir)
if not os.path.exists(mask_savedir):
os.makedirs(mask_savedir)
# ----------------------------------------------------------------------------- #
# 先resize到原来高宽的1/4的尺寸
# 然后等比例裁剪为6份(阴差阳错的也成了矩形688*688)、以及滑动剪裁512*512尺寸,当不够的时候就往回剪裁
filelist = os.listdir(mask_dir) # 只要有mask,那必然有orig
for file in filelist:
filename, _ = os.path.splitext(file)
file_path = os.path.join(orig_dir, file) # 都是png格式的
# --------------------------读取并缩放为原来的1/2----------------------------- #
image = Image.open(file_path) # 用PIL打开图像
image = ImageOps.exif_transpose(image) # 消除相机的exif信息
mask_filepath = os.path.join(mask_dir, file)
mask = Image.open(mask_filepath)
mask = ImageOps.exif_transpose(mask) # 消除相机的exif信息
w, h = image.size
small_w, small_h = w // 4, h // 4
small_image = image.resize((small_w, small_h), Image.ANTIALIAS)
smalll_mask = mask.resize((small_w, small_h), Image.ANTIALIAS)
# ------------------------------------------------------------------------- #
# --------------------------等比例裁剪为6份----------------------------------- #
if small_w > small_h:
row, col = 2, 3 # 如果宽>高,则裁剪为2行3列
else:
row, col = 3, 2
stride1, stride2 = small_w // col, small_h // row
for x in range(0, small_w, stride1):
for y in range(0, small_h, stride2):
box = (x, y, x + stride1, y + stride2)
image_crop = small_image.crop(box)
mask_crop = smalll_mask.crop(box)
cnt = len(os.listdir(images_savedir)) + 1
image_crop.save(os.path.join(images_savedir, filename + f'_{cnt}.png'))
mask_crop.save(os.path.join(mask_savedir, filename + f'_{cnt}.png'))
# ------------------------------------------------------------------------- #
# --------------------------滑动剪裁为大小为 512*512的---------------------------- #
length = 512
for x in range(0, small_w, length):
for y in range(0, small_h, length):
# 用PIL的crop来剪裁,需要box=(xmin, ymin, xmax, ymax)
tempx = x if x + length < small_w else small_w - length
tempy = y if y + length < small_h else small_h - length
box = (tempx, tempy, tempx + length, tempy + length)
image_crop = small_image.crop(box)
mask_crop = smalll_mask.crop(box)
cnt = len(os.listdir(images_savedir)) + 1
image_crop.save(os.path.join(images_savedir, filename + f'_{cnt}.png'))
mask_crop.save(os.path.join(mask_savedir, filename + f'_{cnt}.png'))
print(f'{file} has been processed.')
print('done.')