python多张不同大小的图片按照间距合并/填充

一道算法题需要按照间距合并多张不同大小的图片,故自己实现了一下,该拼接图片的方法也可用于论文插图。

题目
1、在尺寸为 2048 * 2048 的黑色背景图片中,依次填充 images 中的气球图片,气球图片的间隔至少大于 20 个像素,填充完成并保存,如果填充溢出,可保存多张图片。
2、annotations.json 中对应每一个气球的标注的掩膜坐标信息,请根据 annotations 中的格式生成新的 json 标注文件,并确保新生成的 json 标注文件里的掩膜坐标信息对应需求 1 中保存的图片。
3、请验证需求 2 中新生成 json 文件掩膜标注信息的正确性。

  • 代码中仅实现了题目中的问题1,也就是合并images文件夹中的25张图片,这里25张图的比例大小不一样,采用等比例resize然后填充的方法,将图片大小都调整到512x512来实现,其中设置了间距interval,interval=0时,每张512x512的图为无缝连接的。
  • 设定背景图为纯黑色2048x2048,实现时按照4行4列合并,25张图片会自动保存为2张2048x2048的图,一张中是16张,一张中是9张,如文末的merge1.jpg和merge2.jpg所示。
  • 可以修改背景图尺寸、行数、列数、图片间间隔,可用于论文图片排版。
# -*- coding: utf-8 -*- 
import cv2
import os
import numpy as np


def cv_show(name, img, k=0, width=512, height=512):
    cv2.namedWindow(name, cv2.WINDOW_NORMAL)
    cv2.resizeWindow(name, width, height)
    cv2.imshow(name, img)
    cv2.waitKey(k)


def letter_box(image, dim, interval=0):
    h, w = dim
    h -= interval * 2
    w -= interval * 2
    height, width = image.shape[0], image.shape[1]
    ratio = min(w/width, h/height)
    nw = int(width * ratio)
    nh = int(height * ratio)
    dh = (h-nh)//2
    dw = (w-nw)//2
    resized_image = cv2.resize(image, (nw, nh))
    output = np.zeros((dim[0], dim[1], 3), dtype=np.uint8)
    output[dh+interval:dh+interval+nh, dw+interval:dw+interval+nw, :] = resized_image

    return output, ratio, dh, dw


if __name__ == '__main__':
    root_path = './images/'
    names = os.listdir(root_path)
    imgs = [cv2.imread(os.path.join(root_path, name)) for name in names]

    merge_size = (2048, 2048)   # 背景图尺寸
    rows = 4                    # 行数设定
    columns = 4                 # 列数设定
    interval = 20               # 图片间的最小间隔

    # 计算子图需要resize的尺寸
    assert merge_size[0] % columns == 0 and merge_size[1] % rows == 0, '%s or %s is not multiples of %s' % (rows, columns, merge_size)
    h = merge_size[0] // columns
    w = merge_size[1] // rows

    # 计算需要几张背景图
    if len(names) <= rows*columns:
        num = 1
    else:
        if len(names) % (rows*columns) == 0:
            num = len(names)//(rows*columns)
        else:
            num = len(names)//(rows*columns)+1
    canvas = np.zeros((num, merge_size[0], merge_size[1], 3), dtype=np.uint8)

    # 合并图片
    cnt = 0
    for n in range(len(names)):
        for k in range(num):
            for j in range(columns):
                for i in range(rows):
                    if cnt == len(names):
                        break
                    canvas[k][j*h:(j+1)*h, i*w:(i+1)*w, :], ratio, dh, dw = letter_box(imgs[cnt+n//(rows*columns)], (h, w), interval=interval)
                    # TODO: 读入json数据,通过ratio, dw, dh, interval计算合并后的新位置
                    # cv_show('black', canvas[k])
                    cnt += 1
            cv2.imwrite('merge_%s.jpg' % k, canvas[k])
    print('cnt: ', cnt)

合并后的效果如下:
merge1.jpg
在这里插入图片描述

merge2.jpg
在这里插入图片描述

2023.3.20日更新。
有人问第二题和第三题的代码。具体思路:第二问就是读入已知json数据,通过ratio, dw, dh, interval计算合并后的新位置,输出新位置的json。第三问就是读入第二问输出的json,取出位置并以点的形式绘制,可视化结果无误即证明第二问输出的位置正确。
具体我没有写,这里不再写了。以下代码中有读取json和生成json的示例,仅供参考,非第二问和第三问的标准答案。

第二题:label.py

import os
import json
import numpy as np

file = r'.\new2.json'
data = json.load(open(file, encoding='utf-8'))

annotations = {"imagePath": data["imagePath"],
               "imageHeight": data["imageHeight"],
               "imageWidth": data["imageWidth"],
               "shapes": data["shapes"]}

index_name = data["imagePath"].split('\\')[-1]
labels = []
for d in annotations["shapes"]:
    points = np.array(d["points"])
    xs = [float(format(i, '.2f')) for i in points[:, 0]]
    ys = [float(format(i, '.2f')) for i in points[:, 1]]
    shapes = {"name": d["label"],
              "all_points_x": xs,
              "all_points_y": ys}
    labels.append(shapes)
output = {index_name: labels}

file_name = 'new2_annotations.json'
with open(file_name, 'w') as f:
    f.write(json.dumps(output))

第三题:draw.py

import cv2
import numpy as np
import json

file = r'.\new1_annotations.json'
data = json.load(open(file, encoding='utf-8'))
annotatioins = data["new1.jpg"]
img = cv2.imread(r'new1.jpg')
for annotatioin in annotatioins:
    name = annotatioin["name"]
    xs = annotatioin["all_points_x"]
    ys = annotatioin["all_points_y"]
    if len(xs) == len(ys):
        for i in range(len(xs)):
            cv2.circle(img, (int(xs[i]), int(ys[i])), 4, color=(0, 255, 0))
cv2.namedWindow('label', flags=cv2.WINDOW_NORMAL)
cv2.resizeWindow('label', width=1024, height=1024)
cv2.imshow('label', img)
cv2.waitKey(0)
cv2.imwrite('new1_labels.jpg', img)
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值