交叉熵在机器学习中的使用

最新推荐文章于 2024-07-28 15:37:27 发布

Liz1111

最新推荐文章于 2024-07-28 15:37:27 发布

阅读量194

点赞数

文章标签：人工智能数据结构与算法

原文链接：http://www.cnblogs.com/yzh1024/p/11262900.html

版权

交叉熵在机器学习中的使用

1、信息量

概率越小，信息量越大，事件\(X=x_0\)的信息量为：
\[I(x_0)=-log(p(x_0))\]

2、熵

熵表示所有信息量的期望：
\[H(x)=-\sum_{i=1}^n p(x_i)log(p(x_i))\]
其中n代表事件X有n种可能

3、相对熵（KL散度）

\[D_{KL}(p||q)=\sum_{i=1}^np(x_i)log(\frac{p(x_i)}{q(x_i)}\]
物理意义：如果用P来描述目标问题，而不是用Q来描述问题，得到的信息增量

在机器学习中，P往往表示样本的真实分布，q表示模型预测的分布，相对熵越小，表示q分布和p分布越接近

4、交叉熵

相对熵可以变形为：
\[D_{KL}(p||q)=-H(p(x))+[-\sum_{i=1}^np(x_i)log(q(x_i))]\]
等式的前半部分是p的熵，后半部分就是交叉熵：
\[H(p,q)=-\sum_{i=1}^np(x_i)log(q(x_i))\]
在机器学习中，我们需要评估labl和predicts之间的差距，可以使用KL散度，但由于KL散度前半部分不变，故在优化过程中，只需要关注交叉熵就行，所以一般在机器学习中直接用交叉熵作为loss函数，评估模型。

机器学习中交叉熵的应用

1、为什么用交叉熵做loss函数

在线性回归中，常常用MSE作loss函数；但在逻辑分类中却不好用，这是需要用交叉熵

2、交叉熵在单分类中的使用

这里的单类别指：每个样本只能有一个类别
交叉熵在单分类问题上的loss函数：
\[loss=-\sum_{j=1}^m\sum_{i=1}^ny_{ji}log(\hat{y}_{ji})\]
这里的预测概率是通过softmax计算，概率合为1

3、交叉熵在多分类中使用

这里的多类别指：每个样本可以有多个类别
交叉熵在多分类问题上的loss问题：
\[loss=\sum_{j=1}^m\sum_{i=1}^n-y_{ji}log(\hat{y}_{ji})-(1-y_{ji})log(1-\hat{y}_{ji})\]
这里的预测是通过sigmoid计算，每个label都是独立分布的，输出归一化

转载于:https://www.cnblogs.com/yzh1024/p/11262900.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
交叉熵在机器学习中的使用

交叉熵在机器学习中的使用1、信息量概率越小，信息量越大，事件\(X=x_0\)的信息量为：\[I(x_0)=-log(p(x_0))\]2、熵熵表示所有信息量的期望：\[H(x)=-\sum_{i=1}^n p(x_i)log(p(x_i))\]其中n代表事件X有n种可能3、相对熵（KL散度）\[D_{KL}(p||q)=\sum_{i=1}^np(x_i)log(\f...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。