交叉熵的理解

最新推荐文章于 2019-12-12 16:40:41 发布

Alphapeople

最新推荐文章于 2019-12-12 16:40:41 发布

阅读量350

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_38241876/article/details/84858812

版权

机器学习专栏收录该内容

81 篇文章 1 订阅

订阅专栏

相对熵（KL散度）：用于描述两个独立分布之间的差异。

对下式变形可以得到：

DKL（P || q）的==ΣI= 1NP（XI）的日志（P（XI）） - ΣI= 1NP（XI）的日志（Q（XI）） - H（P（X））+ [ - Σ I = 1NP（XI）的日志（q（XI））] DKL（p || q）=ΣI= 1NP（XI）的日志（p（XI）） - ΣI= 1NP（XI）的日志（q（XI））= - H（p（X））+ [ - ΣI= 1NP（XI）的日志（q（XI））] $DKL（p || q）= \ sum _ {i = 1} ^ {n} p（x_ {i}）log（p（x_ {i}）） - \ sum _ {i = 1} ^ {n} p（X_ {I}）logq（X_ {I}）） - H（p（X））+ [ - \ sum_ {I = 1} ^ {N} p（X_ {I}数（q（X_ {I }）））] DKL（p || q）= \ sum _ {i = 1} ^ {n} p（x_ {i} log（p（x_ {i}））） - \ sum _ {i = 1 } ^ {n} p（x_ {i}）log（q（x_ {i}）））= - H（p（x））+ [ - \ sum _ {i = 1} ^ {n} p（x_ {I}）日志（q（X_ {I}））]$

等式的前一部分恰巧就是p的熵，等式的后一部分，就是交叉熵：

H（P，Q）= - ΣI= 1NP（XI）的日志（Q（XI））H（P，Q）= - ΣI= 1NP（XI）的日志（Q（XI））

在机器学习中，我们需要评估标签和预测之间的差距，使用KL散度刚刚好，即DKL（Y || Y 1）DKL（Y || Y 1），由于KL散度中的前一部分 - H（y）的-H（y）的不变，故在优化过程中，只需要关注交叉熵就可以了。所以一般在机器学习中直接用交叉熵做损耗，评估模型。

交叉熵用于衡量在给定真实发布下，使用非真实分布所指定的策略消除系统的不确定性所需要付出的努力的大小。

Alphapeople

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
交叉熵的理解

相对熵（KL散度）：用于描述两个独立分布之间的差异。对下式变形可以得到：DKL（P || q）的==ΣI= 1NP（XI）的日志（P（XI）） - ΣI= 1NP（XI）的日志（Q（XI）） - H（P（X））+ [ - Σ I = 1NP（XI）的日志（q（XI））] DKL（p || q）=ΣI= 1NP（XI）的日志（p（XI）） - ΣI= 1NP（XI）的日志（q（XI））= ...
复制链接

扫一扫