《Concentration of Measure for the Analysis of Randomized Algorithms》:读书笔记(1)
Chapter 1: Chernoff-Hoeffding Bound
原文发布于https://zybuluo.com/qqiseeu/note/109942
引文
中心不等式(Concentration Inequality)是分析随机算法的经典工具,在机器学习算法的理论分析中也用的特别多。为了
学习这方面的知识,刚开始我选择的是Massart和Lugosi所著的Concentration Inequalities,无奈数学水平不够,看了一章就实在看不下去了。后来换了这本简单一些的Concentration of Measure for the Analysis of Randomized Algorithms,总算是能往后翻了。这个系列的文章作为读书笔记,希望能够督促自己坚持读完。
Concentration of meature可简单地理解为随机变量在其期望处“聚集”的行为。概率论中已经提供了两个经典工具————大数定律及中心极限定理————来刻画这种现象,然而它们所给出的结果存在几点不足:
- 上述结果只刻画了渐进情况下的性质,然而在分析实际算法时我们更青睐能够应用于finite case的结果
- 上述经典工具给出的是qualitative的结果,但我们更希望有quantitative的结果,也即明确的收敛率
- 上述经典工具给出的结果都基于独立性的假设,然而对于很多复杂的随机算法,独立性是不满足的,因此我们需要不依赖独立性假设的工具。
Chernoff Bound
Chernoff bounding technique指的是用moment-generating function来处理多个随机变量之和的期望的技巧。所谓moment-generating function被定义为随机变量 X 的指数函数的期望
先来看一个简单的例子:考虑独立同分布的Bernoulli随机变量 Xi∼Bernoulli(p) 及它们的和 X=∑i∈[n]Xi ,易见 X∼Binomial(n,p) 。现在要估计 X 偏离其期望一定距离的概率,即
根据 Xi 的独立性,上述式子中的moment-generating function可写成
其中 q=1−p