【深度学习】CVAE的KL损失公式的推导

最新推荐文章于 2024-08-15 20:04:12 发布

UESTC_20172222

最新推荐文章于 2024-08-15 20:04:12 发布

阅读量2.6k

点赞数 4

分类专栏：深度学习（NLP领域）文章标签： NLP CVAE KL

深度学习（NLP领域）专栏收录该内容

19 篇文章 5 订阅

订阅专栏

KL散度，VAE

KL散度（相对熵）

衡量两个概率分布的距离，两个概率分布越相似，KL散度越小，交叉熵越小。表示已知q，p的不确定性程度-p的不确定性程度

交叉熵：表示已知分布p后q的不确定程度，用已知分布p去编码q的平均码长

交叉熵在分类任务中为loss函数

往往交叉熵比均方误差做loss函数好

1.均方差求梯度太小，在深度网络中，随着网络变深，会出现梯度消失，即梯度饱和问题，因此交叉熵做loss函数比较好。

2.均方误差是一个非凸的函数，cross-entropy是一个凸函数。

如两个高斯分布的KL散度KL(p1||p2)如下：

当其中一个是标准正太分布时，

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

UESTC_20172222 CSDN认证博客专家 CSDN认证企业博客

码龄9年

117: 原创

5万+: 周排名

195万+: 总排名

34万+: 访问

: 等级

4019: 积分

82: 粉丝

209: 获赞

37: 评论

639: 收藏

私信

关注

分类专栏

最新评论

【机器学习】几种常见的概率分布
太简单了: 很喜欢博主的讲述方式
【pytorch学习】torch.zeros
weixin_41452275: 请问哪里有demo2呀 y=x.t()是x矩阵的转置吗
【深度学习】LSTM为什么会可以解决梯度消失问题
blowers: 请问作者，一共四张图后面你说的从【从上图可以看出：】后面两句话跟四张图的那些值对上呢？这四张图是否可以增加一些说明呢？横轴是函数值除以导数值的话，那么函数值和导数值在图上的哪里？
【pytorch学习】torch.zeros
wq_0708: 数据在内存上连续存储的，torch的张量默认是行优先，所以对于行维，想访问第二行就得跳5个，对于列维，想访问第二列只需跳1个。注意，转置后的张量是列优先
【深度学习】sentencepiece工具之BPE训练使用
kun996: 这样我为什么不直接用subword-wmt?

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。