KL散度loss和交叉熵loss的不同

绿你蓝友

已于 2022-03-10 20:04:57 修改

阅读量2.8k

点赞数 1

分类专栏：深度学习loss 文章标签：机器学习人工智能

于 2022-03-10 20:03:43 首次发布

本文链接：https://blog.csdn.net/between5and16/article/details/123409686

版权

深度学习loss 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

KL散度loss和交叉熵loss
交叉熵针对的是该标签的预测值到真实值之间的所需的努力
true: [0,0,1, 0, 0]
predicted:[0.1 0.2 0.3 0.35 0.05]
仅仅计算第三个位置处的差异
loss = -1log(0.3)

而交叉熵针对的所有标签的预测值同对应的所有真实值之间相互的差异
（此处也可以是两组预测值的差异分布，不一定是真实值，可以是两组预测值，两者做loss，从而实现两组预测的分布趋同）
即 predicted到true 和 true到predicted
predicted1: [0.4 0.1 0.2 0.3]
predicted2:[0.1 0.2 0.3 0.4]
loss1 = 0.4log(0.4/0.1) +0.1log(0.1/0.2) + 0.2log(0.2/0.3) + 0.3log(0.3/0.4)
反映了predicted2的分布到达 predicted1 所需要的努力

loss2 = 0.1log(0.1/0.4) + 0.2log(0.2/0.1) + 0.3log(0.3/0.2) + 0.4log(0.4/0.3)
反映了predicted1的分布到达 predicted2 所需要的努力

上面两个值取平均。获得带权重相加也可以。
loss = aloss1 + bloss2 , a>0, b>0, a+b=1
比如一组是真实数据得来的预测值，
一组是真实数据加了扰动后得到的数据，
可以适当适得a>0.5 而 b< 0.5