估计数据分布梯度：如何克服现有生成式模型的缺陷

AITIME论道

于 2021-01-14 17:41:56 发布

阅读量6.3k

点赞数 3

文章标签：机器学习人工智能深度学习计算机视觉数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AITIME_HY/article/details/112646147

版权

斯坦福大学博士生宋飏提出了一种基于估计数据分布梯度的新方法，用于生成式模型，以克服现有显式和隐式模型的局限。通过计分函数表示数据分布，该方法避免了归一化要求，实现了更灵活的模型结构和稳定的训练。计分估计、切片计分匹配和条件计分函数模型等技术被用来生成高质量样本，甚至在CIFAR-10数据集上打破了记录。

摘要由CSDN通过智能技术生成

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

现有的生成式模型方法通常基于用最大似然训练的显式概率模型，或者用对抗训练学习的隐式采样模型。前者需要变分推理，或者模型具有特殊设计的结构。后者的训练通常极不稳定。

在 AI TIME PhD NeurIPS 专场二中，我们有幸邀请到斯坦福大学计算机系博士生宋飏，他们提出了一种基于估计数据分布梯度的新方法，来克服以上两种模型的缺点。

宋飏：本科毕业于清华大学物理系，现为斯坦福大学计算机系博士生，导师为Stefano Ermon教授。致力于研究具有灵活的模型结构，稳定的训练方式，优异的样本质量，以及能够自由控制的新型生成式模型。

一、背景

近些年来，生成式模型经历了迅猛的发展。目前在图像生成方面，生成式模型可以生成极为逼真的图片。

图1 生成式模型生成的人脸图像

在自然语言处理方面，生成式模型也能够产生非常连贯和通顺的句子。如图2所示的句子补全，输入the best generative model is（最好的生成模型是），生成式模型给出了“最好的生成式模型是能够随着时间不断的演化，并且可以预测大脑整体的结构与功能。”这样的完整句子。

图2 生成式模型句子补全

1.1 生成式模型的工作方式

生成式模型本质上是一组概率分布。如下图所示，左边是一个训练数据集，里面所有的数据都是从某个数据p_data中独立同分布取出的随机样本。右边就是其生成式模型（概率分布），在这种概率分布中，找出一个分布p_θ使得它离p_data的距离最近。接着在p_θ上采新的样本，可以获得源源不断的新数据。

图3 生成式模型的工作方式

1.2 现有的生成式模型

由于生成式模型是一组概率分布，根据模型如何去表示这个概率分布，模型可以被分为隐式生成式模型和显式生成式模型。

1.2.1 隐式生成式模型

GAN生成式对抗网络就是隐式生成式模型，

最低0.47元/天解锁文章

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。