信息论概述

ww要努力呀

于 2023-01-04 21:20:57 发布

阅读量75

点赞数

分类专栏： # 复习内容

本文链接：https://blog.csdn.net/wwang_123/article/details/128554600

版权

10 篇文章 2 订阅

订阅专栏

熵：不确定性的度量，类别不均匀程度的度量

最大熵：一种状态的平衡分布，可看作一种自然法则

互信息：随机变量相关性的度量

熵的相关定义：熵、条件熵、联合熵、相对熵、互信息

最大熵模型：求取类别后验概率分布p(y|x)

最小互信息模型：例如，独立成分分析

信息量（信息增益量）：

$I(x_{k})=log(\frac{1}{p_{k}})=-logp_{k}$
- $X=\{x_{k}|k=0,\pm1,...,\pm N \},\ p_{k}=P(X=x_{k}),\ 0\le p_{k}\le 1,\ \sum_{k=-N}^{N}p_{k}=1$
信息量性质：概率越小的状态，信息量越大
- $p_{k}=1,\ I(x_{k})=0$
- $0\le p_{k}\le 1,\ I(x_{k})\ge 0$
- $p_{k}<p_{i},\ I(x_{k})>I(x_{i})$

信息熵：

信息量在全部数值域上的概率平均值
离散熵： $H(x)=E[I(x)]=\sum_{k=-N}^{k=N}p_{k}I(x_{k})=-\sum_{k=-N}^{k=N}p_{k}logp_{k}$
微分熵： $h(x)=-\int_{-\infty }^{\infty}p_{x}(x)logp_{x}(x)dx=-E[logp_{x}(x)]$
- 微分熵不是严格意义上的信息熵
- 性质
  - 平移不变 $h (X + c) = h (X)$
  - 尺度变化
    - $h (c X) = h (X) + l o g ∣ c ∣$
    - $h (A X) = h (X) + l o g ∣ d e t (A) ∣$
    - 其中，c为常数，A为矩阵，det(A)是矩阵A的行列式

条件信息量： $L(x|y)=log\frac{1}{p(x|y)}$

条件熵：

给定y，X的条件熵 $H(X|y)=\sum_{x}p(x|y)log\frac{1}{p(x|y)}$
给定Y，X的条件熵： $H(X|Y)=\sum_{y}p(y)H(X|y)=\sum_{y}p(y)\sum_{x}p(x|y)log\frac{1}{p(x|y)}=\sum_{y}\sum_{x}p(x,y)log\frac{1}{p(x|y)}$

联合熵：

联合熵密度： $p (x, y) = p (x ∣ y) p (y) = p (y ∣ x) p (x)$
联合信息量： $L(x,y)=log\frac{1}{p(x,y)}$
联合微分熵： $H(X,Y)=\sum_{y}\sum_{x}p(x,y)log\frac{1}{p(x,y)}$
- $H (X, Y) = H (X ∣ Y) + H (Y) = H (Y ∣ X) + H (X)$