Python实现不同文件间批量图像的拼接——制作自己的pix2pix数据集

una_mattina7

已于 2023-03-21 12:23:42 修改

阅读量1.8k

点赞数 6

分类专栏： python 机器学习文章标签： python 开发语言

于 2022-11-17 14:50:54 首次发布

本文链接：https://blog.csdn.net/qq_42691298/article/details/127903600

版权

python 同时被 2 个专栏收录

7 篇文章 18 订阅

订阅专栏

机器学习

7 篇文章 4 订阅

订阅专栏

近期想训练pix2pix模型，苦于没有自己的数据集，本来想从网上找个Python脚本实现下，没想到官方竟然有现成的代码，现予以说明：

以下是官方原文:

We provide a python script to generate pix2pix training data in the form of pairs of images {A,B}, where A and B are two different depictions of the same underlying scene. For example, these might be pairs {label map, photo} or {bw image, color image}. Then we can learn to translate A to B or B to A:

Create folder /path/to/data with subfolders A and B. A and B should each have their own subfolders train, val, test, etc. In /path/to/data/A/train, put training images in style A. In /path/to/data/B/train, put the corresponding images in style B. Repeat same for other data splits (val, test, etc).

Corresponding images in a pair {A,B} must be the same size and have the same filename, e.g., /path/to/data/A/train/1.jpg is considered to correspond to /path/to/data/B/train/1.jpg.

下面是相应的翻译：

我们提供了一个python脚本，以图像对{A，B}的形式生成pix2pix训练数据，其中a和B是同一基础场景的两种不同描述。例如，这些可能是对{标签地图，照片}或{黑白图像，彩色图像}。然后我们可以学习将A翻译成B或B翻译成A：

创建包含子文件夹A和B的文件夹/path/to/data。A和B应该各自有自己的子文件夹train、val、test等。在/path/to/data/A/train中，将训练图像放在样式A中。在/path/to/data/B/train中，将相应的图像放在样式B中。对其他数据（val、test等）重复相同操作

一对｛A，B｝中的对应图像必须具有相同的大小并具有相同的文件名，例如/path/to/data/A/train/1.jpg被认为对应于/path/to/data/B/train/1jpg。

一旦数据以这种方式格式化，请调用：

python datasets/combine_A_and_B.py --fold_A /path/to/data/A --fold_B /path/to/data/B --fold_AB /path/to/data

这将把每一对图像（A，B）拼接成一个图像文件，准备好进行训练。

下面是实现代码combine_A_and_B.py：

import os
import numpy as np
import cv2
import argparse
from multiprocessing import Pool


def image_write(path_A, path_B, path_AB):
    im_A = cv2.imread(path_A, 1) # python2: cv2.CV_LOAD_IMAGE_COLOR; python3: cv2.IMREAD_COLOR
    im_B = cv2.imread(path_B, 1) # python2: cv2.CV_LOAD_IMAGE_COLOR; python3: cv2.IMREAD_COLOR
    im_AB = np.concatenate([im_A, im_B], 1)
    cv2.imwrite(path_AB, im_AB)


parser = argparse.ArgumentParser('create image pairs')
parser.add_argument('--fold_A', dest='fold_A', help='input directory for image A', type=str, default='../dataset/50kshoes_edges')
parser.add_argument('--fold_B', dest='fold_B', help='input directory for image B', type=str, default='../dataset/50kshoes_jpg')
parser.add_argument('--fold_AB', dest='fold_AB', help='output directory', type=str, default='../dataset/test_AB')
parser.add_argument('--num_imgs', dest='num_imgs', help='number of images', type=int, default=1000000)
parser.add_argument('--use_AB', dest='use_AB', help='if true: (0001_A, 0001_B) to (0001_AB)', action='store_true')
parser.add_argument('--no_multiprocessing', dest='no_multiprocessing', help='If used, chooses single CPU execution instead of parallel execution', action='store_true',default=False)
args = parser.parse_args()

for arg in vars(args):
    print('[%s] = ' % arg, getattr(args, arg))

splits = os.listdir(args.fold_A)

if not args.no_multiprocessing:
    pool=Pool()

for sp in splits:
    img_fold_A = os.path.join(args.fold_A, sp)
    img_fold_B = os.path.join(args.fold_B, sp)
    img_list = os.listdir(img_fold_A)
    if args.use_AB:
        img_list = [img_path for img_path in img_list if '_A.' in img_path]

    num_imgs = min(args.num_imgs, len(img_list))
    print('split = %s, use %d/%d images' % (sp, num_imgs, len(img_list)))
    img_fold_AB = os.path.join(args.fold_AB, sp)
    if not os.path.isdir(img_fold_AB):
        os.makedirs(img_fold_AB)
    print('split = %s, number of images = %d' % (sp, num_imgs))
    for n in range(num_imgs):
        name_A = img_list[n]
        path_A = os.path.join(img_fold_A, name_A)
        if args.use_AB:
            name_B = name_A.replace('_A.', '_B.')
        else:
            name_B = name_A
        path_B = os.path.join(img_fold_B, name_B)
        if os.path.isfile(path_A) and os.path.isfile(path_B):
            name_AB = name_A
            if args.use_AB:
                name_AB = name_AB.replace('_A.', '.')  # remove _A
            path_AB = os.path.join(img_fold_AB, name_AB)
            if not args.no_multiprocessing:
                pool.apply_async(image_write, args=(path_A, path_B, path_AB))
            else:
                im_A = cv2.imread(path_A, 1) # python2: cv2.CV_LOAD_IMAGE_COLOR; python3: cv2.IMREAD_COLOR
                im_B = cv2.imread(path_B, 1) # python2: cv2.CV_LOAD_IMAGE_COLOR; python3: cv2.IMREAD_COLOR
                im_AB = np.concatenate([im_A, im_B], 1)
                cv2.imwrite(path_AB, im_AB)
if not args.no_multiprocessing:
    pool.close()
    pool.join()

una_mattina7

关注

6
点赞
踩
18

收藏

觉得还不错? 一键收藏
3
评论
Python实现不同文件间批量图像的拼接——制作自己的pix2pix数据集

我们提供了一个python脚本，以图像对{A，B}的形式生成pix2pix训练数据，其中a和B是同一基础场景的两种不同描述。例如，这些可能是对{标签地图，照片}或{黑白图像，彩色图像}。在/path/to/data/A/train中，将训练图像放在样式A中。在/path/to/data/B/train中，将相应的图像放在样式B中。，例如/path/to/data/A/train/1.jpg被认为对应于/path/to/data/B/train/1jpg。A和B应该各自有自己的。
复制链接

扫一扫

专栏目录