定义
设 X 1 , X 2 , . . . , X n , . . . X_1,X_2,...,X_n,... X1,X2,...,Xn,... 是一个随机变量序列, A A A 是一个常数,如果对任意 ϵ > 0 \epsilon>0 ϵ>0,有
lim n → ∞ P { ∣ X n − A ∣ < ϵ } = 1 \lim_{n\rightarrow \infty}P\left\{\left|X_n-A\right|<\epsilon \right\}=1 n→∞limP{∣Xn−A∣<ϵ}=1
则称随机变量序列 X 1 , X 2 , . . . , X n , . . . X_1,X_2,...,X_n,... X1,X2,...,Xn,... 依概率收敛于常数 A A A,记作 X n ⟶ P A X_n\stackrel{P}{\longrightarrow}A Xn⟶PA.
我的理解
这是一些特定的随机序列才会有的特性,这个定义主要是因为我们在估计总体的随机变量的数字特征时(例如总体的期望、方差等),如果我们能够找到一个可以收敛于这个数字特征的统计量,例如直观上似乎有(事实上也是)简单随机样本的样本均值收敛于期望,我们就可以通过不断增大随机序列的n,来逼近这个真实的数字特征。
例子
抛硬币,如果我们把统计量设置为 Z n = { 0 反面 1 正面 Z_n=\left\{\begin{aligned}0 \ \ 反面\\1\ \ 正面\end{aligned} \right. Zn={0 反面1 正面,那么无论 n n n 取多大, Z n Z_n Zn 总是在 0 , 1 0,1 0,1两个值之间跳动,显然我们 Z n Z_n Zn是不会依概率收敛于任何常数 A A A 的。
但是如果我们把统计量设置为 X n = ∑ i = 1 n Z n n X_n=\frac{\sum_{i=1}^n Z_n}{n} Xn=n∑i=1nZn,根据我们似乎已经在脑子里根深蒂固的“频率趋近于概率”,它就会收敛于 1 2 \frac{1}{2} 21 了。事实上,根据伯努利大数定律,它确实如此。
总结
定义依概率收敛,主要是为了衡量我们选取的统计量在增加实验次数(或者说样本容量)时,是否可以更加靠近总体真实的数字特征,这样,我们才有增加试验次数的意义。