【论文笔记】DCGAN研读

最新推荐文章于 2023-01-29 18:11:42 发布

机器不学习我学习

最新推荐文章于 2023-01-29 18:11:42 发布

阅读量430

点赞数

分类专栏：论文笔记

本文链接：https://blog.csdn.net/AugustMe/article/details/115398319

版权

论文笔记专栏收录该内容

22 篇文章 0 订阅

订阅专栏

paper地址：https://arxiv.org/pdf/1511.06434.pdf

这篇论文是我第一次真正接触生成对抗网络（GAN）。

GAN在2014年被提出后，随后的DCGAN是第一个使用了卷积进行图像生成的GAN变体。但往往也因此而忽略了原论文最开始的动机——作者们并不是以生成图像为最主要动机，而要解决的是：表征学习问题。
在这里插入图片描述

评估无监督表示学习算法优劣的一种常用手段是：将其作为特征提取器应用在有标签的监督数据集上以评估性能。为了评估DCGAN提取的特征在监督任务上的效果，论文在Imagenet-1k上进行训练，然后使用判别器的所有卷积层特征、通过最大池化来生成4×4空间特征；然后将它们铺平、拼接得到28672维向量。以正则线性L2-SVM分类器进行训练，在cifar10上可达到82.8％的准确率。

DCGAN生成多大的图像？

DCGAN实际上只适合生成32X32和64X64的图像，其中64X64的最为常见。大分辨率图像请参照StyleGAN、PGGAN等！

摘要

近年来，使用卷积神经网络的监督学习被大量应用于计算机视觉应用中。相对地，使用卷积神经网络的非监督学习则被较少的关注。在这项工作中，我们希望可以帮助缩小监督学习和非监督学习在CNN的成功上差距。我们介绍了CNN的一个类，称为深度卷积生成对抗网络（DCGANs），这个网络有着明确的结构约束，并且表明他们对非监督学习有着强烈的可信度。在不同的图像数据集上训练，我们展示出了令人信服的证据，我们的深度卷积对抗对，从对象部分到场景，在生产器和判别器上都能学到层级的表示。此外，我们在一些新的任务上使用学习到的特征，表明了它们在一般化图像的表示上具有通用性。

1. 介绍

从大量无标签数据集中学习可重复使用的特征表示已经是一个热门研究区域。在计算机视觉的背景下，实际上，可以利用不限数量的无标签图像和视频来学习一个好的中间表示，这个表示可以用在大量有监督的学习任务上，例如图像分类。我们提出一种方法，可以建立好的图像表示，通过训练对抗生成网络（GAN），并且反复利用生产网络和辨别网络的一部分作为有监督任务的特征提取。GAN在极大似然技术方面有惊人的潜力。此外，一个有争议性的话题是，它们学习过程，和缺乏启发式的价值函数（例如独立像素的均方差）在表征学习是具有吸引人的前景。GAN被认为训练不稳定，经常导致生成器产生无意义的输出。目前，试图理解和可视化GAN学到了什么以及多层GAN的中间表示，只有有限的发表研究。

在本文中，我们做了如下贡献：

我们提出并验证了在卷积GAN上的结构技术的一系列限制，使其在大多数数据集中可以稳定的训练。我们称这个结构类为深度卷积GAN（DCGAN）。
我们使用训练的辨别器作用于图像分类任务，与其他无监督算法相比展示出了具有竞争力的表现。
我们把从GAN中学到的滤波器形象化，实验表明，不同的滤波器可以绘制不同的对象。
我们展示出，生产器的一个有趣的向量运算属性，生成样本的很多语义特征可以做出简单的计算。

2. 相关工作

2.1 无标签数据的表示学习

无监督表示学习不仅在一般的计算机视觉研究中，而且在图像的背景下，都是一个相当值得研究的问题。无监督表示学习的传统方法都是在数据集上使用聚类（如K-means），通过聚类器来提高分类上的得分。在图像的背景下，可以对图像块进行分层聚集，来学到更有力的图像表示。另一个流行的方法是训练自动编码器（卷积、堆积、分离编码中组件、梯形结构的内容和位置），这可以将图像编码为紧致码，并且将编码解码来尽可能准确地重新构建图像。这些方法在图像像素上展示出良好的特征表示。深度信念网络在学习层级结构的表示上也展示出了良好的效果。

2.2 自然图像的生成

图像生成模型有了成熟的发展并分成两个类别：参数的和无参数的。

无参数模型经常从一些已存在图像的数据集中做匹配，经常匹配图像块，已经用在了纹理合成、超分辨率和图像修复上。

参数模型对于生成图像已经有了广阔的探索（比如，MNIST数据集合纹理合成）。然而，生成真实世界中的自然图像直到最近也没有取得特别大的成功。对于生成图像一个变化的抽样方法已经取得了一些成功，但是样本经常受到模糊的影响。另一个生成图像的方法使用迭代前向扩散过程。生成对抗网络对于生成图像，需要承受噪音并且难以理解的。对这个方法的一个拉普拉斯金字塔的延伸展示了更高的图像质量，但是，由于链接多个模型引入了噪音，这仍要承受对象看起来不稳定的问题。一个递归网络方法和去卷积网络方法在自然图像的生成上取得了一些成功，但是它们并没有将生成器利用于监督学习任务。

待定。。。。