从概率视角深入理解交叉熵损失函数

一、似然函数

似然函数是一个函数,自变量是概率。一个例子快速帮助理解

抛掷一枚特制的银币10次,正面向上出现7次,反面向上出现3次,问,正面的概率P是多少?

答案是不言而喻的?

怎么计算呢?

其实这个过程就利用了似然函数

假设正面概率为\theta

P = \theta ^{7}*(1-\theta^{3})=L(\theta )

注意,上面以\theta为自变量的函数就叫做似然函数

我们使得“正面向上出现7次,反面向上出现3次”这一事件发生的概率最大

即  max L(\theta )时候的\theta就是我们要求的\theta

直接上图

 

 \theta取0.7时达到最大值。

很神奇吧,我们一开始居然能一下子说出P = \theta ^{7}*(1-\theta^{3})=L(\theta )的极大值点为0.7。

 二、多分类交叉熵损失

我们继续一个例子来帮助直观理解

给定一个三面体,有A/B/C三面,做二十次抛掷,记录落地一面,出现的结果为A10,B3,C7

仍然来求每面朝地的概率pa,pb,pc

这个时候,有两个未知数pa,pb,1-pa-pb

我们可以向上边一样列出似然函数,并且可以直接得出极值点

对于一个多变量的优化问题,其实可以视为只出现两种结果,A和非A

因此仍然可以通过二分类进行求解

同样的,在机器学习中,给定标签0,0,1

对应于实验中出现的次数

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值