《On Positive-Unlabeled Classification in GAN 》学习笔记

最新推荐文章于 2024-03-12 10:08:37 发布

符尔摩斯

最新推荐文章于 2024-03-12 10:08:37 发布

阅读量2.5k

点赞数 2

文章标签：机器学习计算机视觉

本文链接：https://blog.csdn.net/kkx2218813/article/details/104670000

版权

论文摘要

作者提出了一种新的GAN模型，区别于以往的GAN模型，新模型的判别器的目的不再是区分真实样本和判别器生成的样本，而是区分高质量图片样本和低质量的样本，其中高质量的样本就有可能来自生成器。

以往模型的痛点

在普通的GANs模型中，训练进度通常缺乏稳定性，并且生成的图像质量并不总是令人满意的。例如，DCGAN为生成器和鉴别器精心设计了神经体系结构，以缓解这些问题。Progressive GAN通过逐步深化网络生成高分辨率图像。BigGAN 通过改进训练方法（扩大批量大小，并缩短潜在空间）。WGAN和WGANGP试图调整和优化Wasserstein距离以稳定生成过程。SNGAN证明了将Lipschitz连续性引入判别器的必要性和好处。
但是，它们都没有摆脱最初在标准GAN中建立的正负分类问题。现有的GAN模型忽略了生成的样本的质量不相同这一事实。作者认为将高质量的样本与劣质的样本同等对待是不公平的，尤其是当高质量的样本足够接近现实时。
作者认为GAN模型面临的问题已经由原本的正负分类问题（判别器判断是真实样本还是生成器生成的假样本）变成了positive-unlabeled的分类问题。
什么是positive-unlabeled的分类问题？作者认为只要通过适当的训练，生成器生成的样本可以非常接近真实数据，甚至比真实数据更加“真实”。那么这一部分的高质量生成数据就不应该被当成假数据来对待，应该将他们归为未标记数据，未标记数据包括了低质量数据和高质量数据。

GAN模型回顾

众所周知，GAN模型的目标函数：
在这里插入图片描述
其中 $p_{data}$ 指的是真实数据的概率分布， $z$ 是服从先验概率 $p_z$ 的随机噪声， $D (x)$ 是判别器D预测 $x$ 为真的概率。
为了防止判别器训练的太好时造成生成器的梯度消失，某些GAN模型如：WGAN和LSGAN将(1)式修改为
在这里插入图片描述

PU 分类

首先定义生成器生成的数据集为 $x_g$ ，其中高质量的样本为 $x_{gr}$ ，低质量的样本为 $x_{gf}$ 。我们认为真实数据 $x_{data}$ 和高质量样本 $x_{gr}$ 都是真实的（ $y_{gr}=y_{data}=1$ ），同时认为低质量样本 $x_{gf}$ 为假（ $y_{gf}=-1$ ）。
$p_g(x)$ 为 $x_g$ 的边缘密度； $p_{gr}(x) = p(x\mid1)$ 和 $p_{gf} (x) = p(x \mid-1)$ 分别为 $x_{gr}$ 和 $x_{gf}$ 的类条件密度。所以 $p_g(x)$ 可以表示为：
在这里插入图片描述
其中π是一个未知的先验概率（ $x_{gr}$ 在 $x_g$ 中所占的比例）
为了从 $x_g$ 中区分出 $x_{gr}$ 和 $x_{gf}$ ，我们需要最小化判别器D的误分类率 $R (D)$ ，即：

其中 $l (D (x), 1)$ 是损失函数，用于测量真实标签为t时预 $D (x)$ 的损失。
在我们的定义中，好的样本非常接近于真实的样本，于是就可以用 $p_{data}$ 代替 $p_{gr}$ ，所以：
在这里插入图片描述
类似地，低质量的样本 $p_{gf}$ 可以表达为：

于是可以得到如下等式：

将(4)和(7)结合起来，可以得到新的目标函数：

为了防止(8)等式右边的第二第三项为负值而导致过拟合，将(8)改写为：

生成器的目标函数：
在这里插入图片描述
到这里为止，我们已经实现了对生成器生成数据进行不同的处理。
附上算法流程图：

PU 分类的普适性

PU分类还有一点比较牛批，就是这种分类方法可以灵活地适用于其他的GAN模型，包括之前提及的SpectualGAN，LSGAN和WGAN等。
使用PU分类的GAN模型的目标函数为：
在这里插入图片描述
结合使用不同的GAN模型时，(11)中的 $f 1$ 和 $f 2$ 为特定模型中对应的损失函数。

理论分析

理论一

对于固定的生成器G，最优判别器D为：
在这里插入图片描述
其中 $p_gf(x)$ 为生成器生成的低质量样本的概率分布

理论二

最佳判别器已经确定，则生成器的优化目标是最小化：
在这里插入图片描述

结论

当且仅当 $p_{gf} = p_g =p_{data}$ 时，才能实现上述的整体目标函数 $V (G, D)$

实验

使用的数据集：MNIST , FMNIST ,CIFAR-10 , CAT , and LSUN-bedroom
在这里插入图片描述
选择了标准GAN (SGAN), LSGAN,WGAN-GP 和 HingeGAN作为参考，将PU标准的方法与这些模型结合起来并进行比较

表一显示的是FID 分数，可以看到使用了PU方法的模型的表现比相对应的基础模型的表现更好。

使用PUSGAN生成高分辨率的图片。

评估先验概率 $π$ 的影响

在这里插入图片描述
蓝线： $π$ 初始化为0.1，每次迭代平滑增长直至0.7
粉线： $π$ 初始化为0.3，每10000次迭代增加0.1直至0.7
灰线： $π$ 固定为0.3
红线： $π$ 固定为0.5
黑色虚线：没有使用PU标准的GAN，用来对比

评估生成数据量大小的影响

在这里插入图片描述

符尔摩斯

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
《On Positive-Unlabeled Classification in GAN 》学习笔记

论文摘要作者提出了一种新的GAN模型，区别于以往的GAN模型，新模型的判别器的目的不再是区分真实样本和判别器生成的样本，而是区分高质量图片样本和低质量的样本，其中高质量的样本就有可能来自生成器。以往模型的痛点在普通的GANs模型中，训练进度通常缺乏稳定性，并且生成的图像质量并不总是令人满意的。例如，DCGAN为生成器和鉴别器精心设计了神经体系结构，以缓解这些问题。Progressive GA...
复制链接

扫一扫