面试快速复习(二):交叉熵为什么有用

交叉熵CrossEntropy

多分类交叉熵公式为:
J = − 1 m ∑ i = 1 m ∑ k = 1 K y k ( i ) l o g ( p k ( i ) ) \Large J = -\frac{1}{m}\sum_{i=1}^m\sum_{k=1}^K y_k^{(i)}log(p_k^{(i)}) J=m1i=1mk=1Kyk(i)log(pk(i))
其中 m m m表示样本数量, K K K表示类别数量, y k ( i ) y_k^{(i)} yk(i)表示第 i i i个样本第 k k k个类别的值,独热编码表示,当 y i y_i yi属于第 k k k类时为1,否者为0。 p k ( i ) p_k^{(i)} pk(i)表示第 i i i个样本的第 k k k类的预测分数。

由于独热编码的特殊表示,不等于该类时 y = 0 y=0 y=0,所以 ∑ k = 1 K y k ( i ) l o g ( p k ( i ) ) \sum_{k=1}^K y_k^{(i)}log(p_k^{(i)}) k=1Kyk(i)log(pk(i)) 最后只有属于那一类的值有效,如此时真实类别为类别1,则 ∑ k = 1 K y k ( i ) l o g ( p k ( i ) ) = y 1 ( i ) l o g ( p 1 ( i ) ) = l o g ( p 1 ( i ) ) \sum_{k=1}^K y_k^{(i)}log(p_k^{(i)}) = y_1^{(i)}log(p_1^{(i)}) = log(p_1^{(i)}) k=1Kyk(i)log(pk(i))=y1(i)log(p1(i))=log(p1(i))

所以其实对于一个单独的样本,只需要考虑一组 1 1 1 p p p的关系

画出 y = l o g ( x ) y = log(x) y=log(x)的函数图

在这里插入图片描述

可以看出,当 p p p接近0时, − l o g ( p 1 ( i ) ) -log(p_1^{(i)}) log(p1(i))越大(本来是负值,加上交叉熵 J J J前面的负号就是正的了),越接近1损失越小

p = 0.03 p = 0.03 p=0.03时, l o g ( p ) = − 3.50 log(p) = -3.50 log(p)=3.50 l o s s = − l o g ( p ) = 3.50 loss = -log(p) = 3.50 loss=log(p)=3.50

p = 0.5 p = 0.5 p=0.5时, l o g ( p ) = − 0.69 log(p) = -0.69 log(p)=0.69 l o s s = − l o g ( p ) = 0.69 loss = -log(p) = 0.69 loss=log(p)=0.69

这样将多分类任务转化成了在log函数上的模型预测值与1之间的距离关系,距离1越近损失越低,距离0越近损失越高

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

锌a

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值