UA MATH636 信息论6 微分熵
之前讨论的熵都是基于离散型随机变量讨论的,现在考虑基于连续型随机变量来定义熵。假设 X X X是连续型随机变量,概率密度函数为 f ( x ) f(x) f(x),定义 X X X的支撑集为
S u p p ( X ) = { x : f ( x ) > 0 } Supp(X) = \{x:f(x)>0\} Supp(X)={ x:f(x)>0}
Differential Entropy
定义微分熵为
h ( X ) = − ∫ S u p p ( X ) f ( x ) ln f ( x ) d x h(X)=-\int_{Supp(X)}f(x)\ln f(x) dx h(X)=−∫Supp(X)f(x)lnf(x)dx
因为 f ( x ) f(x) f(x)要用来做对数运算,所以要排除掉 f ( x ) = 0 f(x)=0 f(x)=0的部分,一般就把这个积分直接定义在 X X X的支撑集上了。
例1(均匀分布的微分熵)
如果 X ∼ U [ 0 , a ] X \sim U[0,a] X∼U[0,a],则 f ( x ) = 1 a f(x)=\frac{1}{a} f(x)=a1,
h ( X ) = − ∫ 0 a 1 a ln 1 a d x = ln a h(X) = -\int_0^a \frac{1}{a} \ln \frac{1}{a} dx = \ln a h(X)=−∫0aa1lna1dx=lna
与离散型随机变量的熵不同,微分熵可能为负。在这个例子中,如果 0 < a < 1 0<a<1 0<a<1, h ( X ) < 0 h(X)<0 h(X)<0。另外, e h ( X ) e^{h(X)} eh(X)表示支撑集 S u p p ( X ) Supp(X) Supp(X)的Lebesgue测度,即
e h ( X ) = ∣ S u p p ( X ) ∣ e^{h(X)} = |Supp(X)| eh(X)=∣Supp(X)∣
在这个例子中, e h ( X ) = a e^{h(X)}=a eh(X)=a, a a a是区间 [ 0 , a ] [0,a] [0,a]的Lebesgue测度。
例2(正态分布的微分熵)
如果 X ∼ N ( 0 , σ 2 ) X \sim N(0,\sigma^2) X∼N(0,σ2),则
f ( x ) = 1 2 π σ exp ( − x 2 2 σ 2 ) ln f ( x ) = − x 2 2 σ 2 − ln 2 π σ f(x) = \frac{1}{\sqrt{2\pi}\sigma} \exp(-\frac{x^2}{2\sigma^2}) \\ \ln f(x) = -\frac{x^2}{2\sigma^2} - \ln \sqrt{2 \pi} \sigma f(x)=2πσ1exp(−2σ2x2)lnf(x)=−2σ2x2−ln2πσ
支撑集为 S u p p ( X ) = R Supp(X)=\mathbb{R} Supp(X)=R,从而
h ( X ) = − ∫ − ∞ ∞ f ( x ) ln f ( x ) d x = ∫ − ∞ ∞ [ x 2 2 σ 2 + ln 2 π σ ] f ( x ) d x = E X 2 2 σ 2 + ln 2 π σ = ln 2 π σ + 1 2 = 1 2 ln 2 π e σ 2 h(X) = -\int_{-\infty}^{\infty} f(x) \ln f(x) dx \\ = \int_{-\infty}^{\infty} [\frac{x^2}{2\sigma^2} + \ln \sqrt{2 \pi} \sigma]f(x) dx \\ = \frac{EX^2}{2\sigma^2} + \ln \sqrt{2 \pi}\sigma = \ln \sqrt{2 \pi}\sigma + \frac{1}{2} = \frac{1}{2} \ln 2 \pi e \sigma^2 h(X)=−∫−∞∞f(x)lnf(x)dx=∫−∞∞[2σ2x2+ln2πσ]f(x)dx=2σ2EX2+ln2πσ=