前言
环境配置:puthon3.6.9 + pytorch1.1.0 + CUDA10.1 + RTX 2080TI(12G)
代码链接: NVIDIA /pix2pixHD
原文地址:High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
数据集:自己制作,也可调用默认戴姆勒奔驰路测数据集
使用自己数据集训练说明
1、如果您想使用自己的数据集进行训练,请生成标签映射,它是一个通道,其像素值对应于对象标签(即0、1、…,N-1,其中N为标签数量)。这是因为我们需要从标签映射生成一个热点向量。在培训和测试期间,请特别注意–base_options中的参数label_nc。
2、如果您的输入不是标签映射,请指定–label_nc = 0(本人此处指定的就是0,可以理解为和实例、语义都无关,仅仅是图像翻译,达到的效果类似pix2pix),它将直接使用RGB颜色作为输入。文件夹应该命名为train_A, train_B,而不是train_label, train_img,其目标是将图像从A转换为B。
3、如果您没有实例映射或者不想使用它们,请指定–no_instance。
4、预处理的默认设置是scale_width,它将把所有训练图像的宽度调整为opt.loadSize(1024),同