[数学学习]数学知识回顾之概率统计与信息论

最新推荐文章于 2022-10-24 17:10:34 发布

mapw1993

最新推荐文章于 2022-10-24 17:10:34 发布

阅读量823

点赞数 1

分类专栏：机器学习与数据挖掘学习文档

本文链接：https://blog.csdn.net/u010536377/article/details/50295611

版权

学习文档同时被 2 个专栏收录

30 篇文章 1 订阅

订阅专栏

机器学习与数据挖掘

16 篇文章 1 订阅

订阅专栏

Logistic回归模型
- Logistic分布
联合界与Hoeffding不等式
- 联合界定理
- Hoeffding不等式
极大似然估计
信息论基本理论

Logistic回归模型

Logistic分布

Logistic分布的定义如下。

设 $X$ 是连续随机变量， $X$ 服从Logistic分布是指 $X$ 具有下列分布函数和密度函数。
$F(x)=P(X \leq x)=\frac{1}{1+e^{-(x-\mu )/\gamma}}$
$f(x)=F'(x)=\frac{e^{-(x-\mu )/\gamma}}{\gamma (1+e^{-(x-\mu )/\gamma})^2}$
式中， $\mu$ 为位置参数， $\gamma >0$ 为形状参数。

Logistic分布的密度函数 $f(x)$ 和分布函数 $F(x)$ 的图形如下所示。
这里写图片描述
分布函数是关于点 $(\mu,\frac{1}{2})$ 为中心对称，即满足：
$F(-x+\mu)-\frac{1}{2}=-F(x+\mu)+\frac{1}{2}$ 曲线在中心附近增加速度较快，在两端增长速度较慢。形状参数 $\gamma$ 的值越小，曲线在中心附近增长得越快。

联合界与Hoeffding不等式

联合界定理

定义：
令 $A_1,A_2,...,A_k$ 是 $k$ 个时间，这 $k$ 个事件可以相互独立也可以不相互独立，那么有下面结论：
$P(A_1 \cup A_2 \cup...\cup U_k ) \leq P(A_1)+P(A_2)+...+P(A_k)$

该定理可以用Venn图来表示如下。
这里写图片描述
圆A,B,C分别代表着事件A,B,C发生的概率，之间有重叠，所以ABC任意一个发生的概念是小于三者发生的概率之和的。

Hoeffding不等式

定义：令 $Z_1,Z_2,...,Z_k$ 为k个独立同分布变量，服从伯努利分布，即：
$P(Z_i=1)=\varphi,P(Z_i=0)=1-\varphi$
我们使用者m个变量的平均值来估计 $\varphi$ ,得到
$\varphi'=\frac{1}{m}\sum_{i=1}^mZ_i$

那么Hoeffding不等式的定义即为对于任意的固定数值 $\gamma>0$ ,存在：

$P(|\varphi'-\varphi|)\leq 2e^{-2\gamma^2m}$

意义：当样本足够大时，可以认为对参数的估计逼近真实值。

极大似然估计

信息论基本理论

信息论这门学科是香农建立的。笔者学习过这门课，学习完信息论，感觉信息论是一门哲学，很有意思。对于数学和信道编码有兴趣的读者可以学习下。

熵

熵表示的是随机变量不确定性的度量。

一个离散型随机变量 $X$ 的熵 $H(X)$ 定义为

$H(X)=-\sum_{x \in \chi}p(x)\log p(x)$

其中对数 $log$ 所用的底是2，约定 $0\log 0=0$
关于熵的理解可以想一下掷硬币，当硬币均匀时，掷硬币的结果的不确定是最大的。因为它正反的概念都是0.5，此时它的熵最大。如下图所示。
来源自网络

联合熵

给出联合熵的定义：

对于服从联合分布为 $p(x,y)$ 的一对离散随机变量 $(X,Y)$ ，其联合熵 $H(X,Y)$ 定义为： $H(X,Y)=-\sum_{x \in \chi} \sum_{Y \in Y'}p(x,y)\log p(x,y)$
注意：(Y的向量空间打不出来，我这里用Y’表示)

条件熵

给出条件熵的定义：

$H(Y|X)=\sum_{i=1}^np_{i}H(Y|X=x_{i})$

链式法则

$H(X,Y)=H(X)+H(Y|X)$

互信息

互信息一般用I来表示，互信息 $I(X;Y)$ 是在给定Y知识的条件下 $X$ 的不确定度的缩减量。
其公式为

$I(X;Y)=H(X)-H(X|Y)$

互信息的概念在李航统计学习方法中又称为信息增益。

本博文参考了：

1.李航《统计学习方法》，清华大学出版社
2.Thomas M. Cover Joy A. Thomas 《Information theory》
3.《数学分析》第三版，复旦大学。高等教育出版社。