python多张不同大小的图片按照间距合并/填充

Julyers

已于 2023-03-20 17:25:09 修改

阅读量1.6k

点赞数 1

分类专栏： python 文章标签： python opencv

于 2022-11-06 21:43:31 首次发布

本文链接：https://blog.csdn.net/weixin_41631106/article/details/127721469

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一道算法题需要按照间距合并多张不同大小的图片，故自己实现了一下，该拼接图片的方法也可用于论文插图。

题目：
1、在尺寸为 2048 * 2048 的黑色背景图片中，依次填充 images 中的气球图片，气球图片的间隔至少大于 20 个像素，填充完成并保存，如果填充溢出，可保存多张图片。
2、annotations.json 中对应每一个气球的标注的掩膜坐标信息，请根据 annotations 中的格式生成新的 json 标注文件，并确保新生成的 json 标注文件里的掩膜坐标信息对应需求 1 中保存的图片。
3、请验证需求 2 中新生成 json 文件掩膜标注信息的正确性。

代码中仅实现了题目中的问题1，也就是合并images文件夹中的25张图片，这里25张图的比例大小不一样，采用等比例resize然后填充的方法，将图片大小都调整到512x512来实现，其中设置了间距interval，interval=0时，每张512x512的图为无缝连接的。
设定背景图为纯黑色2048x2048，实现时按照4行4列合并，25张图片会自动保存为2张2048x2048的图，一张中是16张，一张中是9张，如文末的merge1.jpg和merge2.jpg所示。
可以修改背景图尺寸、行数、列数、图片间间隔，可用于论文图片排版。

# -*- coding: utf-8 -*- 
import cv2
import os
import numpy as np


def cv_show(name, img, k=0, width=512, height=512):
    cv2.namedWindow(name, cv2.WINDOW_NORMAL)
    cv2.resizeWindow(name, width, height)
    cv2.imshow(name, img)
    cv2.waitKey(k)


def letter_box(image, dim, interval=0):
    h, w = dim
    h -= interval * 2
    w -= interval * 2
    height, width = image.shape[0], image.shape[1]
    ratio = min(w/width, h/height)
    nw = int(width * ratio)
    nh = int(height * ratio)
    dh = (h-nh)//2
    dw = (w-nw)//2
    resized_image = cv2.resize(image, (nw, nh))
    output = np.zeros((dim[0], dim[1], 3), dtype=np.uint8)
    output[dh+interval:dh+interval+nh, dw+interval:dw+interval+nw, :] = resized_image

    return output, ratio, dh, dw


if __name__ == '__main__':
    root_path = './images/'
    names = os.listdir(root_path)
    imgs = [cv2.imread(os.path.join(root_path, name)) for name in names]

    merge_size = (2048, 2048)   # 背景图尺寸
    rows = 4                    # 行数设定
    columns = 4                 # 列数设定
    interval = 20               # 图片间的最小间隔

    # 计算子图需要resize的尺寸
    assert merge_size[0] % columns == 0 and merge_size[1] % rows == 0, '%s or %s is not multiples of %s' % (rows, columns, merge_size)
    h = merge_size[0] // columns
    w = merge_size[1] // rows

    # 计算需要几张背景图
    if len(names) <= rows*columns:
        num = 1
    else:
        if len(names) % (rows*columns) == 0:
            num = len(names)//(rows*columns)
        else:
            num = len(names)//(rows*columns)+1
    canvas = np.zeros((num, merge_size[0], merge_size[1], 3), dtype=np.uint8)

    # 合并图片
    cnt = 0
    for n in range(len(names)):
        for k in range(num):
            for j in range(columns):
                for i in range(rows):
                    if cnt == len(names):
                        break
                    canvas[k][j*h:(j+1)*h, i*w:(i+1)*w, :], ratio, dh, dw = letter_box(imgs[cnt+n//(rows*columns)], (h, w), interval=interval)
                    # TODO: 读入json数据，通过ratio, dw, dh, interval计算合并后的新位置
                    # cv_show('black', canvas[k])
                    cnt += 1
            cv2.imwrite('merge_%s.jpg' % k, canvas[k])
    print('cnt: ', cnt)

合并后的效果如下：
merge1.jpg
在这里插入图片描述

merge2.jpg
在这里插入图片描述

2023.3.20日更新。
有人问第二题和第三题的代码。具体思路：第二问就是读入已知json数据，通过ratio, dw, dh, interval计算合并后的新位置，输出新位置的json。第三问就是读入第二问输出的json，取出位置并以点的形式绘制，可视化结果无误即证明第二问输出的位置正确。
具体我没有写，这里不再写了。以下代码中有读取json和生成json的示例，仅供参考，非第二问和第三问的标准答案。

第二题：label.py

import os
import json
import numpy as np

file = r'.\new2.json'
data = json.load(open(file, encoding='utf-8'))

annotations = {"imagePath": data["imagePath"],
               "imageHeight": data["imageHeight"],
               "imageWidth": data["imageWidth"],
               "shapes": data["shapes"]}

index_name = data["imagePath"].split('\\')[-1]
labels = []
for d in annotations["shapes"]:
    points = np.array(d["points"])
    xs = [float(format(i, '.2f')) for i in points[:, 0]]
    ys = [float(format(i, '.2f')) for i in points[:, 1]]
    shapes = {"name": d["label"],
              "all_points_x": xs,
              "all_points_y": ys}
    labels.append(shapes)
output = {index_name: labels}

file_name = 'new2_annotations.json'
with open(file_name, 'w') as f:
    f.write(json.dumps(output))

第三题：draw.py

import cv2
import numpy as np
import json

file = r'.\new1_annotations.json'
data = json.load(open(file, encoding='utf-8'))
annotatioins = data["new1.jpg"]
img = cv2.imread(r'new1.jpg')
for annotatioin in annotatioins:
    name = annotatioin["name"]
    xs = annotatioin["all_points_x"]
    ys = annotatioin["all_points_y"]
    if len(xs) == len(ys):
        for i in range(len(xs)):
            cv2.circle(img, (int(xs[i]), int(ys[i])), 4, color=(0, 255, 0))
cv2.namedWindow('label', flags=cv2.WINDOW_NORMAL)
cv2.resizeWindow('label', width=1024, height=1024)
cv2.imshow('label', img)
cv2.waitKey(0)
cv2.imwrite('new1_labels.jpg', img)