交叉熵（Cross Entropy）

最新推荐文章于 2024-05-14 23:27:57 发布

huangjx36

最新推荐文章于 2024-05-14 23:27:57 发布

阅读量2.2k

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

13 篇文章 8 订阅

订阅专栏

交叉熵应用到机器学习问题的简要介绍

　　　交叉熵可以用于定义机器学习问题和最优化问题的损失函数。我们可以假定，真实标签中正类别的概率为 $p_i$ ，而当前训练出的模型的预测值是正类别的概率是 $q_i$ ，这样我们可以通过交叉熵计算 $p_i$ 和 $q_i$ 的相似度，然后对模型进行进一步的优化。
　　　使用一个更加具体的例子，我们使用逻辑回归（logistic regression）作为处理二分类问题的模型，定义两个类别分别为 $0$ 和 $1$ 。这样的话，我们可以将结果的概率模型定义为 $g(z) = 1 / (1 + e^{-z})$ 。当我们要计算 $y=1$ 的概率的时候，我们通过以下公式进行计算：

q y = 1 = y^\equiv g (w \cdot x) = 1 / (1 + e - w \cdot x)

$q_{y=1} = \hat y \equiv g(w \cdot x) = 1 / (1 + e^{-w \cdot x})$ 这里，权重向量

w $w$ 是通过梯度下降等优化算法计算出来的。相同的，

y=0 $y = 0$ 的互补概率可以简单地表示为：

q y = 0 = 1 - y^

$q_{y=0}=1-\hat y$ 上述的两个公式表示的是当前模型预测值的概率分布。
　　　对于数据的真实概率分布，我们可以表达为：

py=1=y $p_{y=1}=y$ 和

py=0=1−y $p_{y=0}=1-y$ 。
　　　综合上述的概率表达，我们可以将真实概率表达为

p∈{y,1−y} $p \in \{y, 1-y\}$ ，并且将预测概率表达为

q∈{y^,1−y^} $q \in \{\hat y, 1-\hat y\}$ 。这样的话，我们可以通过交叉熵来测量

p $p$ 和

q $q$ 之间的相似度：

H (p, q) = - \sum i p i log q i = - y log y^- (1 - y) log (1 - y^)

$H(p, q) = - \sum_i p_i \log q_i = -y \log \hat y - (1 - y) \log (1-\hat y)$ 这个公式其实就是在逻辑回归中计算某个数据样本的损失的表达式，要想计算整个模型的损失，我们只需要计算所有数据样本的损失的平均值即可：

L (w) = 1 N \sum n = 1 N H (p n, q n) = - 1 N \sum n = 1 N [y n log y^n + (1 - y n) log (1 - y^n)]

$L(w) = \frac {1}{N} \sum_{n=1}^{N} H(p_n, q_n) = - \frac{1}{N} \sum_{n=1}^{N}[y_n \log \hat y_n + (1-y_n) \log (1- \hat y_n)]$ 这里

y^n≡g(w⋅xn)=11+e−w⋅xn $\hat y_n \equiv g(w \cdot x_n) = \frac{1}{1+e^{-w \cdot x_n}}$ ，

g(z) $g(z)$ 就是逻辑函数。

参考资料

交叉熵-维基百科 https://en.wikipedia.org/wiki/Cross_entropy

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
交叉熵（Cross Entropy）

交叉熵应用到机器学习问题的简要介绍
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。