DivCo: Diverse Conditional Image Synthesis viaContrastive Generative Adversarial Network

最新推荐文章于 2024-07-10 11:32:19 发布

葛葎蔓酒花

最新推荐文章于 2024-07-10 11:32:19 发布

阅读量815

点赞数

分类专栏：笔记文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/jtup1253/article/details/127256740

版权

笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一、前置知识

条件生成对抗网络（cGANs）:条件生成对抗网络(cGAN) - 知乎 (zhihu.com)

对比学习：对比学习（Contrastive Learning），必知必会 - 知乎 (zhihu.com)

二、关于本文

目前研究所处瓶颈及其所面对的问题：

(a)两个不同类别的分布，其中每个类别都是高斯混合模型。

(b)使用潜在回归损失（ Latent regression loss：鼓励图像和潜在空间之间的可逆映射）学习到的结果，可以看出误差较大。

(c)Mode seeking loss :通过最大化两个任意图像的不相似性来提高生成多样性,但从上图生成的结果来看，当两个采样的潜在编码（潜在分布特征）之间的距离可能很接近，它们的合成图像不仅被很好的区分，而且根据它最大近似分布的特点学习到新的分布很容易变的偏差极大，也就是说，生成结果只取决于潜在编码（潜在分布特征）而忽略了条件输入。

(d)由本文提出的潜在增广对比损失的学习分布生成的样本，它表现出了极强的无偏差分布，该分布适当地依赖于条件输入和潜在编码（潜在分布特征）。

简单的总结本文所作出的工作：本文工作的核心重点在于，在GAN生成网络开始进行生成工作之前，通过加入类标签的有监督方式进行初步分类，将输入图片的感兴趣部分称为‘positive’或者’正‘区域，同时非感兴趣区域称为‘negative'或者负区域。并近似的将正区域中的点形成一个个的超球体，超球体内正相关超球体外负相关。将对比学习的重点侧重于我们感兴趣的超球体内。

而在此之前cGan的工作其实主要集中于图片的像素级区域的对比与学习，引入超球体的概念是一种增强学习的过程。即插即用也是本文提出方法的一个理论关键点。

具体来看：

应用方法part1：该部分主要完成特征图像的生成，上图中第一部分完成对原始图片中感兴趣部分的混合生成，具体来说z∼N(0，1)即该点所处位置为“P”or"N",之后通过第一次生成得到 $\widehat{x}$ 这一批的类加权图像，之后使用这批类加权图像生成我们GAN网络的特征图片。（图片到图片，翻译为我们想要的目标特征图片），注意在这部分中直接使用了生成器中的编码层作为辅助编码器，即 $G_{enc}$ 于 $G$ 编码层使用相同的代码。