集中不等式 (Concentration inequality)

最新推荐文章于 2024-05-27 18:48:47 发布

敲代码的quant

最新推荐文章于 2024-05-27 18:48:47 发布

阅读量5.3k

点赞数 9

分类专栏： probability and statistics 文章标签：集中不等式 concentration inequality

本文链接：https://blog.csdn.net/FrankieHello/article/details/90814143

版权

probability and statistics 专栏收录该内容

7 篇文章 3 订阅

订阅专栏

在概率论中，集中不等式提供了随机变量偏离一些值（如期望）的上限。

马尔科夫不等式（Markov’s Inequality）

假设 $X$ 是一个非负的随机变量，对于所有常数 $\alpha > 0$ ，有：
$\geq \alpha) \leq \frac{E(X)}{\alpha}$
关于马尔科夫不等式的拓展，如果 $\phi$ 是一个严格递增且非负的函数，有：
$\geq \alpha) = P(\phi(X) \geq \phi(\alpha))\leq \frac{E(\phi(X))}{\phi(\alpha)}$

契比雪夫不等式（Chebyshev’s Inequality）

对于随机变量 $X$ ，对于所有常数 $\alpha > 0$ ，有：
$\geq \alpha) \leq \frac{Var(X)}{\alpha^{2}}$
或者表示为：
$\geq \alpha \cdot Std(X)) \leq \frac{1}{\alpha^{2}}$
其中， $S t d (X)$ 是随机变量 $X$ 的标准差。切比雪夫不等式是马尔科夫不等式对于随机变量 $X - E (X)$ 的情况，所以说切比雪夫不等式是马尔科夫不等式的特殊情况，并且这两个不等式的提出者巴夫尼提·列波维奇·切比雪夫和安德雷·马尔可夫是师生关系。

霍夫丁不等式（Hoeffding’s Inequality）

上面的马尔科夫和切比雪夫不等式都是一般性的，收敛性都比较 loose，为了得到收敛性更强的不等式，也就是指数形式的不等式，

对于独立随机变量 $X_{1}, X_{2}, ..., X_{n}$ ，对于所有的 $X_{i}$ 有 $a_{i} \leq X_{i} \leq b_{i}$ ， $S_{n} = \sum_{i=1}^{n}X_{i}$ ， $E_{n} = E(S_{n})= \sum_{i=1}^{n}E(X_{i})$ ，可以得到随机变量的和与其期望偏差之间的上界，有不等式：
$P(|S_{n} - E_{n}| \geq t) \leq 2 exp(-\frac{2t^{2}}{\sum_{i=1}^{n}(a_{i} - b_{i})^{2}})$
也可以得到随机变量的算数平均值与其期望之间的偏差之间的上界，有不等式：
$P(|\bar{X_{n}} - E(\bar{X_{n}})| \geq t) \leq 2 exp(-\frac{2n^{2}t^{2}}{\sum_{i=1}^{n}(a_{i} - b_{i})^{2}})$

班纳特不等式（Bennett’s Inequality）

班纳特不等式也是用于衡量独立随机变量的和与其期望之间偏差。与Hoeffding的不等式相比，当和的方差小于它们几乎确定的界限时，Bennett不等式提供了一些改进。

对于独立随机变量 $X_{1}, X_{2}, ..., X_{n}$ ，对于所有的 $X_{i}$ 有 $X_{i} \leq a$ ， $S_{n} = \sum_{i=1}^{n}X_{i}$ ， $E_{n} = E(S_{n}) = \sum_{i=1}^{n}E(X_{i})，V_{n} = Var(S_{n}) = \sum_{i=1}^{n}Var(X_{i})$ 可以得到随机变量的和与其期望偏差之间的上界，有不等式：
$P(|S_{n} - E_{n}| \geq t) \leq 2 exp(-\frac{V_{n}}{a^{2}}h(\frac{at}{V_{n}}))$
其中， $h (u) = (1 + u) l o g (1 + u) - u$

伯恩斯坦不等式（Bernstein’s Inequality）

对于独立随机变量 $X_{1}, X_{2}, ..., X_{n}$ ，对于所有的 $X_{i}$ 有 $b_{i} \leq X_{i} \leq a_{i}$ ， $b_{i} - a_{i}\leq C$ , $S_{n} = \sum_{i=1}^{n}X_{i}$ ， $E_{n} = E(S_{n}) = \sum_{i=1}^{n}E(X_{i})，V_{n} = Var(S_{n}) = \sum_{i=1}^{n}Var(X_{i})$ 可以得到随机变量的和与其期望偏差之间的上界，有不等式：
$P(|S_{n} - E_{n}| \geq t) \leq 2exp(-\frac{t^{2}/2}{V_{n} + Ct/3})$
这是Hoeffding的一个推广，因为它不仅可以处理独立变量，也可以处理弱独立变量。

补充

集中不等式在实际中经常会被用到，而在使用这些集中不等式的时候，对数据分布也是有要求的，通常是假设数据的分布函数是具有尾部收敛性质。

REF

Wiki Concentration Inequality

敲代码的quant

关注

9
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
集中不等式 (Concentration inequality)

在概率论中，集中不等式提供了随机变量偏离一些值（如期望）的上限。马尔科夫不等式（Markov’s Inequality）假设XXX是一个非负的随机变量，对于所有常数α&gt;0\alpha &gt; 0α>0，有：P(X≥α)≥E(X)αP(X \geq \alpha) \geq \frac{E(X)}{\alpha}P(X≥α)≥αE(X)关于马尔科夫不等式的拓展...
复制链接

扫一扫

专栏目录