信息量,熵,交叉熵

参考自:https://blog.csdn.net/tsyccnh/article/details/79163834在这里插入图片描述

信息量

信息量是对事件发生概率的一个度量,事件发生的概率越小,事件所包含的信息量越多。
举个例子:巴西进入世界杯,中国进入世界杯,这个事件从直觉来说是第二个小概率事件所包含的信息量多
所以香农提出了一个定量衡量信息量的公式:
在这里插入图片描述

熵是表示一种事件不确定性的一种衡量,对于一个存在不确定性的系统,熵值越高,不确定性的因素越大,熵值为0,表示没有任何不确定性:
在这里插入图片描述
从公式可以看出,熵值就是对系统中各事件的信息量的期望值。对于一个只存在两种可能性系统,他的熵值即为:
在这里插入图片描述
所以系统中不确定最大,即熵值为0的时候,即每个概率相等的时候。

相对熵(KL散度)

用于衡量两个分布之间的差异程度,公式:
在这里插入图片描述
kl散度的解释:用P描述目标问题,而不是Q来描述目标问题所得到的信息增量

交叉熵

将KL散度的公式进行化简:
在这里插入图片描述
公式的第一项化简后是P的熵,即真实分布的熵,这个是固定不变的,所以我们在优化的KL散度的时候,只需要关注后面一项,即为交叉熵

交叉熵用来很好衡量预测概率和真实概率之间差异,计算公式:
在这里插入图片描述
其中P(i)是真实分布,Q(i)是预测分布

交叉熵在机器学习中的应用:

对于回归问题来说,经常使用MSE作为loss函数。
在这里插入图片描述
在分类问题中即使用交叉熵作为loss函数
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值