主要在此文基础上精简,按自己理解表达下【直观详解】信息熵、交叉熵和相对熵
- 熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。
- 信息熵,描述信源的不确定度。
信息熵
越大,越无序,越随机,信息量(的期望)越大,要消除不确定性所需信息量越大。
考虑把信息量存储下来需要多大空间/存储代价
(用存储空间表示信息熵(不确定性越高所需存储空间越大))
举例:表示天气情况的 P=[p1,p2,p3,p4] P = [ p 1 , p 2 , p 3 , p 4 ] ,通常做法表示为[00,01,10,11],共2bit
S=∑i=14(Pi×F(Pi)) S = ∑ i = 1 4 ( P i × F ( P i ) )
F(Pi) F ( P i ) 表示存储空间, Pi P i 表示事件i的概率,公式表示各个事件需要的存储空间期望和
概率越大,存储空间越小(哈夫曼编码)
F(Pi)=1Pi;F(