指示随机变量
指示随机变量(indicator random variable,IRV)是概率分析中非常重要的一种离散随机变量,其用来表征某事件是否发生。更加具体的,假设事件A发生,变量IRV取值为1,否则取值为0. 数学上表述为:
指示随机变量是采用概率分析问题的一中基本手段。那么为什么要采用这种随机变量呢?首先:指示随机变量非常简单,对于任何概率问题都是可行的,并且该随机变量取值也比较简单。
指示随机变量可分解性质(尽管某事件之间存在关联),从而其能够在求取期望值时的良好数学性质。
例如,假设我们抛N次硬币,每次抛硬币都可能存在两种取值,朝上或者朝下,我们用0和1表示,他们是等概率出现的。我们问出现正面朝上的期望值?
用X表示抛N次硬币,正面朝上总次数的期望值。那么我们可以将X分解,假设
表示第i次抛硬币,出现正面朝上的事件。那么抛N次硬币的正面朝上总次数可以表示为:
因此在计算
上面我们采用了指示随机变量,即
引理:给定一个样本空间S和S中的一个事件A,设
,那么
.
随机算法
一般的,如果一个算法的行为不仅由输入决定,而且也由随机数生成器产生的数值决定,则称这个算法是随机的。这里,输入是指一个未知的数据分布,这个数据我们无法准确建模,只能采用一些概率知识进行分析。另外,在算法执行过程中,某些关键步骤仍然是由电脑产生的随机数决定,即是说算法的执行是不确定的。
实际上,所有的采样算法都是随机的,包括Metropolis算法,权重采样算法等。具体的采样算法简介可以参考本人之前写的文章。科学摆渡人:采样方法(Sampling Method)zhuanlan.zhihu.com
在分析一个随机算法的运行时间时,我们以运行时间的期望值衡量,其中输入值由随机数生成器产生。我们将一个随机算法的运行时间称为期望运行时间,以此来区分这类算法和那些输入是随机的算法。一般而言,当概率分布是在算法的输入上时,我们讨论的是平均情况运行时间;