diffusion模型

常见概率分布及其图像

常见概率分布及图像_常用八大分布函数-CSDN博客

离散

连续分布

概率期望

KL散度:【KL散度】【相对熵】从相似到不同的度量,探测分布之间的差异_哔哩哔哩_bilibili

编码到隐空间是为了压缩信息强迫神经网络学习更有效的信息

AE 和 VAE

无监督学习之VAE——变分自编码器详解 - 知乎

本来解码空间是离散的比如编码到了[5]这个值解码出圆月,编码到了[10]这个值解码出半月。

但是[7]的值不知道是啥。

因此可以加入噪声解码空间变为连续的,圆月的解码空间为5为均值的正态分布,半月就解码为7为均值的正态分布,[7]就被覆盖到了

通过增加更多的噪声来扩展自动编码器(AE)的编码空间,以覆盖更多的区域。在传统的自动编码器中,编码空间通常是离散的,由一组特定的编码点组成。然而,通过引入更多的噪声,可以使得每个输入样本的编码不再是离散的点,而是一个连续的分布,通常是接近正态分布的。这样做的目的是确保对于每个输入样本,其编码都能够覆盖整个编码空间,而不仅仅局限于原始样本周围的区域。

【15分钟】了解变分自编码器_哔哩哔哩_bilibili

讲的太好

具体来说,VAE中的编码器将输入图像映射到潜在空间中的均值向量和方差向量,然后通过这些均值和方差来参数化一个高维空间中的正态分布。通过这个分布,我们可以从潜在空间中采样出一个向量,这个向量就是图像的编码。

因此,虽然每个维度上的值可以看作是从一个近似正态分布中采样得到的,但是这些维度之间是相关联的,它们一起形成了一个高维正态分布。因此,整个向量并不是简单地从64个不同的独立分布中采样得到的,而是从一个多维正态分布中采样得到的。

AE的编码是一个值 VAE的编码是一个分布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值