DeLiGAN: 对于多样性和有限数据的GAN

最新推荐文章于 2024-06-11 09:53:58 发布

Kardel_Chen

最新推荐文章于 2024-06-11 09:53:58 发布

阅读量2.3k

点赞数

分类专栏：深度学习文章标签：计算机视觉深度学习技术人 cvpr2017

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36518123/article/details/79995768

版权

DeLiGAN是一种针对多样性与有限数据的生成对抗网络改进方案。通过引入高斯混合模型来学习输入噪声，解决了原始GAN的模式塌陷问题，增加了生成数据的多样性。此外，DeLiGAN利用L2正则化防止学习到的方差σ变为负值。实验表明，DeLiGAN在多个数据集上表现优于标准GAN，并且对于小样本数据集也有良好效果。

摘要由CSDN通过智能技术生成

DeLiGAN: 对于多样性和有限数据的GAN

前言

技术人还是要写技术文啊，写什么情感大戏啊。

开始遨游CVPR2017，主要是为了学习更多的深度学习网络架构

讲道理计算机视觉的深度学习架构是深度学习各领域比较先进的，比如CNN，自编码器，GAN，注意力机制都是出于CV然后应用于其他领域的。所以即使我不学CV了还是要看CVPR的论文

论文本身

讨论一下GAN的缺点:
1. Mode Collapse：当GAN无法达到识别网络D每趟的运行次数大于生成网络G的时候，生成网络生成的所有内容都将归于同样的对象，比如训练GAN for MNIST最后所有的生成内容都为1
2. 训练速度慢，训练吃数据：原始GAN的生成网络与识别网络都是MLP（不是很懂为什么）。较CNN来说，MLP更吃数据而且运行速度更慢
3. GAN生成数据的多样性来自于GAN的生成者输入的噪音N。原始GAN的噪音是高斯噪音。而这篇文章主要的重点，笔者认为在于尝试去用一个有点想Batch Normalization的方式去学习噪声输入

图右就是DeLiGAN的结构。可以看到，DeLiGAN在输入的时候进行了变化。

2.DeLiGAN
DeLiGAN使输入噪音通过一个高斯混合模型（Mixture-of-Gaussian model）

$p_z(z) = \sum_{i=1}^N\phi_ig(z|\mu_i, \Sigma)$

其中 $\phi_i$ 是权值，也是采用重参数单元（我使用的是指的是 $g(z|\mu_i, \Sigma)$ ）的概率。在文章中 ϕ

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。