【学习记录】图片行列切割与子图行列拼接之中央裁剪法

东荷新绿

已于 2022-04-03 00:01:32 修改

阅读量2.2k

点赞数

分类专栏： # python 文章标签： python

于 2022-04-02 00:31:58 首次发布

本文链接：https://blog.csdn.net/weixin_44853527/article/details/123885672

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

写在前面：本博客仅作记录学习之用，部分图片来自网络，如需使用请注明出处，同时如有侵犯您的权益，请联系删除！

文章目录

前言
分割与拼接
分割检测实例
丰富背景
对比拼接
致谢
共勉之语

前言

本博客仅为学习记录之用，目的在于后续若需要相关的有资可查。在言语上恐有诸多纰漏，如有错误，欢迎指出交流学习！
本博客所包含的大致内容: 大图片的行列分割；基于子图中央裁剪的行列拼接；

分割与拼接

拼接问题

由于子图的大小，长宽很难保证一致，所以直接resize到期望大小会导致图像变形，反之不resize会导致拼接可能存在黑边的情况。
故本文拼接不同于直接将子图resize到期望大小后进行行列的拼接，本文采取的方法是在子图片中央截取期望子图长宽比例的部分，再resize到期望大小后进行拼接(当然也支持直接resize后拼接，设置相关标志位即可)，目的在于避免图片变形而舍弃了边缘的小部分的信息。仅仅个人的想法，如有其他的方法，欢迎留言交流哈！

分割和拼接的用途

将大图片切割后的小图片可用于移动设备的检测减少内存消耗；
同时也可用于小目标检测，小目标一直是检测任务难题，对于大图片而言，小目标在resize之后会很容易丢失；
不同图片拼接成大图可以用于丰富数据集的背景，进一步进行训练可提高网络的鲁棒性。

函数实现

切割函数

def cut_image(pic_path, save_path, cr=None, in_flag=True):
    '''
    :param pic_path: 图片路径
    :param save_path: 保存路径
    :param cr: 行列数
    :param in_flag: 是否手动选择切割图片数
    :return: None
    '''
    pics = natsort.natsorted(os.listdir(pic_path), alg=natsort.ns.PATH)
    num = len(pics)
    print(f'共能以CR={cr}则共能切割{num}张图')
    if in_flag:
        num_pics = int(input('期望切割图片数量：'))
        if num_pics > len(pics):
            num_pics = num
            warm = f'期望图片数目过多，只能切割{num}张图片'
            warnings.warn(warm)
        elif num_pics < 0:
            raise ValueError('num_pics must bigger than zero!')

        elif num_pics == 0:
            print('直接退出！')
            sys.exit()
        else:
            num_pics = num_pics
    else:
        num_pics = num
    print(f'切割的图片已保存到 {save_path} ')
    for pic_name in tqdm(pics[0:num_pics:1]):
        image = Image.open(os.path.join(pic_path, pic_name))
        width, height = image.size
        item_width = int(width / cr[0])
        item_height = int(height / cr[1])
        box_list = []
        image_list = []
        for j in range(0, cr[1]):
            for i in range(0, cr[0]):
                box = (i * item_width, j * item_height, (i + 1) * item_width, (j + 1) * item_height)
                box_list.append(box)
            image_list = [image.crop(box) for box in box_list]
        if len(image_list) > 0:
            save_images(image_list, save_path, pic_name.split('.')[0])
        else:
            raise ValueError('check the img or count_w and count_h')

拼接函数

我们事先假设期望的目标是位于图片中央，因此采取中央裁剪。针对具体的图片也可以修改参数(width/2，width/3)加以判断即可进行从左往右，或者从右往左进行等比例裁剪。

def image_compose(pic_path, pic_save_path='ping', cr=None, wh=None, in_flag=True):
    '''
    :param pic_path: 图片的路径，type:char
    :param pic_save_path: 图片保存位置,type:char
    :param cr: 子图拼接的行列,type:[]
    :param wh: 子图的大小, type:[]
    :param in_flag:是否手动输入拼接图片数量，in_flag=False可关闭手动，type:bool
    :return: 无
    '''
    image_names = natsort.natsorted(os.listdir(pic_path), alg=natsort.ns.PATH)  # 自然数命名文件
    num = int(len(image_names) / cr[0] / cr[1])
    print(f'子图共计{len(image_names)}张，以CR={cr},WH={wh}则共能拼接{num}张图')
    if in_flag:
        num_pics = int(input('期望拼接图片数量：'))
        if num_pics > num:
            num_pics = num
            warm = f'期望图片数目过多，只能拼接{num}张图片'
            warnings.warn(warm)
        elif num_pics < 0:
            raise ValueError('num_pics must bigger than zero!')
        elif num_pics == 0:
            print('直接退出！')
            sys.exit()
        else:
            num_pics = num_pics
    else:
        num_pics = num

    i = 0
    for num in tqdm(range(1, num_pics+1)):
        to_image = Image.new('RGB', (cr[0] * wh[0], cr[1] * wh[1]))   # 创建一个新图
        for y in range(1, cr[1] + 1):
            for x in range(1, cr[0] + 1):
                from_image = Image.open(pic_path + image_names[i])
                crop_image = modify_scale(from_image, wh, crop_flag=False)  # 尺寸不一致时进行裁剪，crop_flag=False则直接缩放
                to_image.paste(crop_image, ((x - 1) * wh[0], (y - 1) * wh[1]))  # 把子图贴在指定位置
                i = i + 1
        to_image.save(pic_save_path + f'/CR-{cr}-WH-{wh}_' + str(num) + '.jpg')  # 保存新图,以子图行列+子图尺寸+自然数命名
    print(f'拼接的图片已保存到 {pic_save_path} ')

中央裁剪法

def modify_scale(pic, WH=None,crop_flag=True):
    '''
    解决黑边，截取图片中心期望比例的部分进行缩放
    :param pic: 输入图片
    :param WH: 期望子图宽高
    :param crop_flag：是否需要中间截取
    :return: 调整尺寸的图片
    '''
    if pic is None:
        raise ValueError('check the picture type!')
    else:
        width, height = pic.size  # 原图片宽高

    if WH[0] == width and WH[1] == height:
        return pic

    elif WH[0]/WH[1] == width/height:
        pic = pic.resize((WH[0], WH[1]), Image.ANTIALIAS)
        return pic
    else:
        if crop_flag:
            if width/height > WH[0]/WH[1]:
                new_width = height * (WH[0]/WH[1])
                new_height = height
                box = [int(width/2-new_width/2), 0, int(width/2+new_width/2), new_height]
            else:
                new_height = width * (WH[1] / WH[0])
                new_width = width
                box = [0, int(height/2 - new_height/2), new_width, int(height/2 + new_height/2)]

            crop_pic = pic.crop(box)  # Image.crop(left, up, right, below)
            crop_pic = crop_pic.resize((WH[0], WH[1]), Image.ANTIALIAS)  # Image.ANTIALIAS 高质量缩放
        else:
            crop_pic = pic.resize((WH[0], WH[1]), Image.ANTIALIAS)
        return crop_pic

完整代码

主程序提供期望子图的大小以及行列数，还有图片的路径即可运行，切割是按照所给的切割行列数，进行相同的大小的切割，而拼接则是裁剪实际子图中央与期望子图比例的部分进行缩放及拼接，下面的图片是拼接的整体思路。
拼接原理说明

# !/usr/bin/env python
# -*- coding:utf-8 -*-
# @Author  : Xiaodong
# @file    : single2image.py
# @Function: Split and stitch images

import os
import sys
from PIL import Image
from tqdm import tqdm
import natsort
import warnings


def cut_image(pic_path, save_path, cr=None, in_flag=True):
    '''
    :param pic_path: 图片路径
    :param save_path: 保存路径
    :param cr: 行列数
    :param in_flag: 是否手动选择切割图片数
    :return: None
    '''
    pics = natsort.natsorted(os.listdir(pic_path), alg=natsort.ns.PATH)
    num = len(pics)
    print(f'共能以CR={cr}则共能切割{num}张图')
    if in_flag:
        num_pics = int(input('期望切割图片数量：'))
        if num_pics > len(pics):
            num_pics = num
            warm = f'期望图片数目过多，只能切割{num}张图片'
            warnings.warn(warm)
        elif num_pics < 0:
            raise ValueError('num_pics must bigger than zero!')

        elif num_pics == 0:
            print('直接退出！')
            sys.exit()
        else:
            num_pics = num_pics
    else:
        num_pics = num
    print(f'切割的图片已保存到 {save_path} ')
    for pic_name in tqdm(pics[0:num_pics:1]):
        image = Image.open(os.path.join(pic_path, pic_name))
        width, height = image.size
        item_width = int(width / cr[0])
        item_height = int(height / cr[1])
        box_list = []
        image_list = []
        for j in range(0, cr[1]):
            for i in range(0, cr[0]):
                box = (i * item_width, j * item_height, (i + 1) * item_width, (j + 1) * item_height)
                box_list.append(box)
            image_list = [image.crop(box) for box in box_list]
        if len(image_list) > 0:
            save_images(image_list, save_path, pic_name.split('.')[0])
        else:
            raise ValueError('check the img or count_w and count_h')


def save_images(image_list, save__path, img_name):
    '''
    :param image_list: 图片列表
    :param save__path: 保存路径
    :param img_name: 图片名字，用于命名
    :return: None
    '''
    index = 0
    for image in image_list:
        if image.mode == "RGBA" or image.mode == "L":
            image = image.convert('RGB')
        image.save(save__path + '/' + str(img_name) + '_' + str(index) + '.jpg')
        index += 1


def modify_scale(pic, WH=None,crop_flag=True):
    '''
    解决黑边，截取图片中心期望比例的部分进行缩放
    :param pic: 输入图片
    :param WH: 期望子图宽高
    :param crop_flag：是否需要中间截取
    :return: 调整尺寸的图片
    '''
    if pic is None:
        raise ValueError('check the picture type!')
    else:
        width, height = pic.size  # 原图片宽高

    if WH[0] == width and WH[1] == height:
        return pic

    elif WH[0]/WH[1] == width/height:
        pic = pic.resize((WH[0], WH[1]), Image.ANTIALIAS)
        return pic
    else:
        if crop_flag:
            if width/height > WH[0]/WH[1]:
                new_width = height * (WH[0]/WH[1])
                new_height = height
                box = [int(width/2-new_width/2), 0, int(width/2+new_width/2), new_height]
            else:
                new_height = width * (WH[1] / WH[0])
                new_width = width
                box = [0, int(height/2 - new_height/2), new_width, int(height/2 + new_height/2)]

            crop_pic = pic.crop(box)  # Image.crop(left, up, right, below)
            crop_pic = crop_pic.resize((WH[0], WH[1]), Image.ANTIALIAS)  # Image.ANTIALIAS 高质量缩放
        else:
            crop_pic = pic.resize((WH[0], WH[1]), Image.ANTIALIAS)
        return crop_pic



def image_compose(pic_path, pic_save_path='ping', cr=None, wh=None, in_flag=True):
    '''
    :param pic_path: 图片的路径，type:char
    :param pic_save_path: 图片保存位置,type:char
    :param cr: 子图拼接的行列,type:[]
    :param wh: 子图的大小, type:[]
    :param in_flag:是否手动输入拼接图片数量，in_flag=False可关闭手动，type:bool
    :return: 无
    '''
    image_names = natsort.natsorted(os.listdir(pic_path), alg=natsort.ns.PATH)  # 自然数命名文件
    num = int(len(image_names) / cr[0] / cr[1])
    print(f'子图共计{len(image_names)}张，以CR={cr},WH={wh}则共能拼接{num}张图')
    if in_flag:
        num_pics = int(input('期望拼接图片数量：'))
        if num_pics > num:
            num_pics = num
            warm = f'期望图片数目过多，只能拼接{num}张图片'
            warnings.warn(warm)
        elif num_pics < 0:
            raise ValueError('num_pics must bigger than zero!')
        elif num_pics == 0:
            print('直接退出！')
            sys.exit()
        else:
            num_pics = num_pics
    else:
        num_pics = num

    i = 0
    for num in tqdm(range(1, num_pics+1)):
        to_image = Image.new('RGB', (cr[0] * wh[0], cr[1] * wh[1]))   # 创建一个新图
        for y in range(1, cr[1] + 1):
            for x in range(1, cr[0] + 1):
                from_image = Image.open(pic_path + image_names[i])
                crop_image = modify_scale(from_image, wh, crop_flag=False)  # 尺寸不一致时进行裁剪，crop_flag=False则直接缩放
                to_image.paste(crop_image, ((x - 1) * wh[0], (y - 1) * wh[1]))  # 把子图贴在指定位置
                i = i + 1
        to_image.save(pic_save_path + f'/CR-{cr}-WH-{wh}_' + str(num) + '.jpg')  # 保存新图,以子图行列+子图尺寸+自然数命名
    print(f'拼接的图片已保存到 {pic_save_path} ')


if __name__ == '__main__':

    IMAGE_W = 2000  # 期望每张子图的大小,无需和实际尺寸一致
    IMAGE_H = 500
    COLUMN = 1  # 列
    ROW = 4     # 行，此时即4张图拼成4行1列，或者将图片分解为4行1列，取决于后续函数选择
    IMAGES_PATH = 'king/'  # 子图路径
    SAVE_PATH = 'ping/'  # 保存路径

    CR = [COLUMN, ROW]
    WH = [IMAGE_W, IMAGE_H]

    if len(os.listdir(IMAGES_PATH)) >= ROW*COLUMN:
        if not os.path.exists(SAVE_PATH):  # 生成保存路径
            os.makedirs(SAVE_PATH)
        cut_image(IMAGES_PATH, save_path=SAVE_PATH, cr=CR)  # 调用函数，分割
        image_compose(SAVE_PATH, SAVE_PATH, CR, WH)  # 调用函数，拼接
    else:
        raise ValueError('Please specify the number of ROW and COLUMN !'
                         'The solutions of the error are decrease the ROW and COLUMN or enlarge the number of images')