【脚本】将image和mask统一等比例resize到高=688后再裁剪右边部分,最终得到688*688大小的图像和标签

实现效果

注意:我将剪裁后的图像也保存的png格式,原因可参考:深度学习中图像格式选用jpg还是png?答:png

import os
from PIL import Image, ImageOps

if __name__ == '__main__':
    orig_dir = r'E:\A_new_dataset\cutorig_tunnel\2_dan\images'
    mask_dir = r'E:\A_new_dataset\cutorig_tunnel\2_dan\masks'

    save_dir = r'E:\A_new_dataset\cutorig_tunnel\2_dan\save'
    # -------------------------------设置存放文件夹-------------------------------- #
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)

    save_len = len(os.listdir(save_dir)) + 1
    images_savedir = os.path.join(save_dir, f'save_{save_len}', 'images')
    mask_savedir = os.path.join(save_dir, f'save_{save_len}', 'mask')

    if not os.path.exists(images_savedir):
        os.makedirs(images_savedir)
    if not os.path.exists(mask_savedir):
        os.makedirs(mask_savedir)
    # ----------------------------------------------------------------------------- #

    filelist = os.listdir(mask_dir)  # 只要有mask,那必然有orig
    for file in filelist:
        filename, _ = os.path.splitext(file)
        file_path = os.path.join(orig_dir, file)
        image = Image.open(file_path)  # 用PIL打开图像
        image = ImageOps.exif_transpose(image)  # 消除相机的exif信息
        w, h = image.size

        mask_filepath = os.path.join(mask_dir, file)
        mask_image = Image.open(mask_filepath)
        mask_image = ImageOps.exif_transpose(mask_image)  # 消除相机的exif信息

        # 裁剪成688
        newsize = (w * 688 // h, 688)
        image_688 = image.resize(newsize, Image.ANTIALIAS)  # 先等比例缩放再裁剪成矩形
        box = (newsize[0] - 688, 0, newsize[0], newsize[1])
        image_crop = image_688.crop(box)

        mask_688 = mask_image.resize(newsize, Image.ANTIALIAS)  # 先等比例缩放再裁剪成矩形
        mask_crop = mask_688.crop(box)

        save_len = len(os.listdir(save_dir)) + 1
        image_crop.save(os.path.join(images_savedir, filename + f'_{save_len}.jpg'))
        mask_crop.save(os.path.join(mask_savedir, filename + f'_{save_len}.png'))
        print(f'{file} has been processed.')

    print('done.')
OpenCV中的resize函数和PyTorch中的F.interpolate函数都可以用来调整图像大小,但它们的使用方法和结果略有不同。 1. resize函数 resize函数可以直接调整图像大小,并且可以选择不同的插值方法来处理图像的像素值。常用的插值方法有:INTER_NEAREST、INTER_LINEAR、INTER_CUBIC和INTER_LANCZOS4。 使用resize函数时,需要指定输出图像大小和插值方法,例如: ```python import cv2 img = cv2.imread('image.jpg') resized_img = cv2.resize(img, (new_width, new_height), interpolation=cv2.INTER_LINEAR) ``` 2. F.interpolate函数 F.interpolate函数是PyTorch中针对张量的插值函数,可以用于调整图像大小。与resize函数不同的是,F.interpolate函数需要将图像转换成PyTorch的张量,然后再进行插值操作。 使用F.interpolate函数时,需要指定输出张量的大小和插值方法,例如: ```python import torch import torch.nn.functional as F img = cv2.imread('image.jpg') tensor_img = torch.from_numpy(img).permute(2, 0, 1).unsqueeze(0).float() resized_tensor_img = F.interpolate(tensor_img, size=(new_height, new_width), mode='bilinear', align_corners=True) resized_img = resized_tensor_img.squeeze().permute(1, 2, 0).numpy().astype('uint8') ``` 3. 区别 resize函数和F.interpolate函数的区别在于: - resize函数可以直接操作图像,而F.interpolate需要将图像转换成张量后再操作。 - resize函数可以选择不同的插值方法,而F.interpolate只能选择双线性插值或最近邻插值。 - F.interpolate函数可以在GPU上进行加速,而resize函数只能在CPU上运行。 因此,如果只需要调整图像大小,可以使用resize函数;如果需要在PyTorch中进行深度学习,可以使用F.interpolate函数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孟孟单单

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值