Re8 Generative Modeling by Estimating Gradients of the Data Distribution

Zhuanshan_

已于 2023-12-08 20:41:41 修改

阅读量515

点赞数 7

文章标签：人工智能

于 2023-11-30 20:50:01 首次发布

本文链接：https://blog.csdn.net/weixin_44796129/article/details/134714432

版权

Introduction

通过近似最大似然直接学习分布的概率密度，如VAE

概率分布由其抽样过程的模型隐式表示，如GAN
在这里插入图片描述
GAN隐式表示了生成器网络可以产生的所有对象的分布。

在这里插入图片描述

给定一个数据样本，需要预测积分函数向量场
因此，我们训练一个积分函数模型Score Model，本身是一个可训练的向量值函数，让其和数据分布的对数的梯度接近
从而，需要一个损失函数来比较两个向量场之间的距离，使用fisher divergence，其用来比较数据分布积分函数和积分函数模型之间的欧式距离的平方。
但是，还是需要依赖积分函数，作者引入Score Matching，通过分步积分的方法将fisher divergence转换为Score Matching objective，其不依赖于积分函数，但是需要计算积分函数模型的雅各比行列式的迹，这对于高维数据来说很难实现。
这里需要计算两个值，一个是向量值函数，一个是雅各比行列式的迹，但是其反向传播的时间复杂度和其参数量同规模，因此score matching没法应用到大规模的数据集上

那么如何在得到分数后进行采样呢
通常，将随机分布的点沿着向量场的方向移动的方式来到达概率比较大的地方，但这样没法产生样本，所有点都集中在一起，引入朗之万采样，一点点的加入噪声，使能够在积分函数向量场中获得希望的概率函数样本
然而，对数据密度较低的区域效果不好
估计不准确是由于数据密度低导致的。所以添加噪声之后，扰动的数据点可以填满原数据分布中概率密度比较低的区域。这样就能获得准确的计分函数估计。
所以在实际中，我们使用多个不同等级的噪声来扰动数据分布得到若干个扰动后的数据分布
然后训练一个积分函数模型，同时估计被噪声扰动之后的数据分布所对应的积分函数向量场，同时也需要一个新的目标函数，称为退火朗之万采样。
实验验证随着噪声数量的增加，样本生成质量越高
因此，可以使用随机微分方程来表示无穷多的噪声分布，其本质是受噪声干扰的微分方程，
可以看到在cifar数据集上的FID和GAN比差不多