漫步数理统计一——绪论

最新推荐文章于 2025-04-30 20:57:30 发布

翻译最新推荐文章于 2025-04-30 20:57:30 发布 · 1.7k 阅读

文章标签：

#数理统计

漫步数理统计专栏收录该内容

34 篇文章

订阅专栏

许多调查可以由部分进行表征，前提是基于以下事实：在基本相同的条件下，重复进行的试验或多或少是标准的程序。例如，在医学研究中关注点集中于待使用药物的效果；或对经济学家而言，关注的可能是三种指定商品在不同时间的价格；或对农艺师而言，可能想研究化肥对谷物产量的影响。调查人员获得此类信息的唯一方法就是进行实验。每个实验都会产生一个结果，但这些试验的特点是在实验进行之前我们无法进行预测。

假设我们有这样一个试验，其结果不能确定的预测出来，但在执行之前，每个可能结果能被准确的描述出来，如果这种试验可以在相同条件下重复进行，我们就被它为随机试验，并且每个可能结果的集合称为试验空间或样本空间。

$\textbf{例1：}$ 现在投掷一枚硬币，背面朝上用T表示，正面朝上用 $H$ 表示，假设在相同的条件下硬币可以重复投掷，那么这个硬币的投掷过程就是一个随机试验的例子，在这个试验中结果就是两个符号 $T,H$ 中的一个；即样本空间是这两个符号的集合。

$\textbf{例2：}$ 现在红白两方每人掷一次骰子，结果用有序数对表示，假设在相同的条件下双方重复掷骰子，那么产生数对过程就是一个随机试验，样本空间有36个有序对组成： $(1,1),\ldots,(1,6),(2,1),\ldots,(2,6),\ldots,(6,6)$ 。

令 $\textbf{C}$ 表示样本空间， $c$ 表示 $\textbf{C}$ 中的一个元素， $C$ 表示 $\textbf{C}$ 中元素的一个集合，如果试验的结果在 $C$ 中，我们就说事件 $C$ 发生了。现在设想我们进行了 $N$ 次随机试验，那么我们可以得出 $N$ 个结果中 $C$ 发生的次数(频数) $f$ ，比率 $f/N$ 称为 $N$ 次试验中事件 $C$ 的相对频率，当 $N$ 很小时相对频率通常不稳定，从掷硬币中就能感觉出来。但是随着 $N$ 的增大，经验表明我们可以将事件 $C$ 与一个数联系起来，假设为 $p$ ，它等于或近似等于相对频率稳定的那个数。如果这么做的话，那么 $p$ 可以看成未来试验中，事件 $C$ 相对频率要么等于要么近似等于的值，因此，虽然我们不能预测随机试验的结果，但是当 $N$ 非常大时，我们预测 $C$ 发生的相对频率。与事件 $C$ 关联的数 $p$ 有许多名字，有时称为试验结果在 $C$ 中的概率；有时称为事件 $C$ 的概率；有时称为 $C$ 的概率测度，通常会根据上下文选择合适的属于。

$\textbf{例3：}$ 令 $\textbf{C}$ 表示例2的样本空间， $C$ 是 $\textbf{C}$ 中满足和等于7的有序对组合的集合，那么 $C$ 就是 $(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)$ 。假设骰子掷了 $N=400$ 次，和等于7的频数 $f=60$ ，那么结果在 $C$ 中的相对频数是 $f/N=\frac{60}{400}=0.15$ ，因此我们可以将 $C$ 与非常靠近0.15的数 $p$ 联系起来， $p$ 称为事件 $C$ 的概率。

$\textbf{注1：}$ 上面概率的解释有时看成相对频率法，它显然依赖这样的事实：试验在基本相同的条件下重复进行。然而，许多人将其看成合理的置信度量，据此将概率应用到其他情况。例如 $p=\frac{2}{5}$ 意味着对于事件 $C$ 而言，他们个人的或主观的概率等于 $\frac{2}{5}$ ，因此，如果他们愿意赌博的话，这可以解释成他们对结果 $C$ 下注的意愿，这样的话两种结果的比率为 $p/(1-p)=\frac{2}{5}/\frac{3}{5}=\frac{2}{3}$ ，并且，如果他们确实相信 $p=\frac{2}{5}$ 是正确的，那么他们更愿意下注到另一方： $(a)$ 如果 $C$ 发生就赢3元，不发生的话输2 元，或者 $(b)$ 如果不发生赢2元，不发生的话输3元。然而，因为概率的数学性质与这两种解释都是一致的，所以数学的发展并不依赖于使用哪种方法。