【概率论】6-1:大样本介绍(Large Random Samples Introduction)

本文探讨了大样本统计分析的两个方向，一是基于独立伯努利试验的二项分布，二是利用大数定律和中心极限定理评估大量随机样本均值接近期望值的概率。通过具体实例展示了大样本下特定事件发生的概率变化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址1：https://www.face2ai.com/Math-Probability-6-1-Large-Random-Samples-Introduction转载请标明出处

Abstract: 本文作为第六章的开篇主要介绍第六章我们要研究的内容
Keywords: Large Random Samples

大样本介绍

本章我们介绍一些近似的结果，简化大量随机样本的分析。

大样本介绍 Introduction

本文通过两个例子来举例两个不同的分析方向，并有不同的分析工具。

🌰 ：
扔一个硬币，你可能感觉出现正反面的概率基本相同，也就是出现正面的概率大概是 $\frac{1}{2}$ ,然而，当你扔10次，出现五次正面的可能性不一定很大。如果你扔100次，也不一定出现正好的50次正面。多次扔硬币的过程可以通过我们前面介绍的二项分布来建模，参数是扔硬币的次数 $n$ 和正面出现的概率 $\frac{1}{2}$ 。那么上述两种情况的概率：
$Pr(X=5)=\begin{pmatrix}10\\5\end{pmatrix}(\frac{1}{2})^{5}(1-\frac{1}{2})^{5}=0.2461\tag{1}$
100次其中50次的概率
$Pr(Y=50)=\begin{pmatrix}100\\50\end{pmatrix}(\frac{1}{2})^{50}(1-\frac{1}{2})^{50}=0.0796\tag{2}$

可见在一定次数 $n$ 的独立实验中，出现 $n / 2$ 的次数的概率并不大，并且试验次数越多，这个概率越小。
但是如果我们把这个概率稍微移动一下，产生一个区间，那么这个概率会急剧上升。
$Pr(0.4\leq \frac{Y}{100}\leq 0.6)=Pr(40\leq Y\leq 60)=\sum^{60}_{i=40}\begin{pmatrix}100\\i\end{pmatrix}(\frac{1}{2})^{i}(1-\frac{1}{2})^{100-i}=0.9648$
即使n不大的到时候
$Pr(0.4\leq \frac{X}{10}\leq 0.6)=Pr(4\leq X\leq 6)=\sum^{6}_{i=4}\begin{pmatrix}10\\i\end{pmatrix}(\frac{1}{2})^{i}(1-\frac{1}{2})^{10-i}=0.6563$

可见，同样的独立试验次数n越大的时候，在 $\frac{1}{2}$ 附近（比如 $[0.4, 0.6]$ ）的概率越大。

上述例子简单就简单在每次试验都是独立的伯努利分布，且概率固定。接下来这个例子稍微复杂一点。

🌰 ：
一个队列的客户，第 $i$ 个客户在队列中等待 $X_i$ 其是随机变量，假设 $X_1,X_2,\dots$ 是i.i.d的，其是 $[0, 1]$ 上的均匀分布，等待的期望是 0.5，所以当用户样本数量足够大的时候这些样本的均值越接近0.5 。但是多个样本的均值的分布其实是很复杂的，可能没办法准确的描述多个样本的均值与0.5的接近程度。