信息熵、交叉熵、相对熵

本文从热力学的熵概念出发,解释了信息熵如何度量信源的不确定度,指出熵越大,不确定性越高,需要的存储空间越大。接着通过例子展示了不同天气概率下的信息熵计算,并引出交叉熵的概念,它用于评估使用非真实分布策略消除系统不确定性所需的努力。交叉熵常作为损失函数衡量模型预测概率与实际分布的相似性。最后提到了相对熵(KL散度),用于衡量两个概率分布的差异,值越小表示两者越接近,当相同时为0。
摘要由CSDN通过智能技术生成

主要在此文基础上精简,按自己理解表达下【直观详解】信息熵、交叉熵和相对熵

  • 熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。
  • 信息熵,描述信源的不确定度。

信息熵越大,越无序,越随机,信息量(的期望)越大,要消除不确定性所需信息量越大。

考虑把信息量存储下来需要多大空间/存储代价
(用存储空间表示信息熵(不确定性越高所需存储空间越大))

举例:表示天气情况的 P=[p1,p2,p3,p4] P = [ p 1 , p 2 , p 3 , p 4 ] ,通常做法表示为[00,01,10,11],共2bit

S=i=14(Pi×F(Pi)) S = ∑ i = 1 4 ( P i × F ( P i ) )

F(Pi) F ( P i ) 表示存储空间, Pi P i 表示事件i的概率,公式表示各个事件需要的存储空间期望和

概率越大,存储空间越小(哈夫曼编码)

F(Pi)=1Pi;F(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值