许多调查可以由部分进行表征,前提是基于以下事实:在基本相同的条件下,重复进行的试验或多或少是标准的程序。 例如,在医学研究中关注点集中于待使用药物的效果;或对经济学家而言,关注的可能是三种指定商品在不同时间的价格;或对农艺师而言,可能想研究化肥对谷物产量的影响。调查人员获得此类信息的唯一方法就是进行实验。每个实验都会产生一个结果,但这些试验的特点是在实验进行之前我们无法进行预测。
假设我们有这样一个试验,其结果不能确定的预测出来,但在执行之前,每个可能结果能被准确的描述出来,如果这种试验可以在相同条件下重复进行,我们就被它为随机试验,并且每个可能结果的集合称为试验空间或样本空间。
例1:
现在投掷一枚硬币,背面朝上用T表示,正面朝上用
H
表示,假设在相同的条件下硬币可以重复投掷,那么这个硬币的投掷过程就是一个随机试验的例子,在这个试验中结果就是两个符号
例2: 现在红白两方每人掷一次骰子,结果用有序数对表示,假设在相同的条件下双方重复掷骰子,那么产生数对过程就是一个随机试验,样本空间有36个有序对组成: (1,1),…,(1,6),(2,1),…,(2,6),…,(6,6) 。
令
C
表示样本空间,
c
表示
注1:
上面概率的解释有时看成相对频率法,它显然依赖这样的事实:试验在基本相同的条件下重复进行。然而,许多人将其看成合理的置信度量,据此将概率应用到其他情况。例如
p=25
意味着对于事件
C
而言,他们个人的或主观的概率等于
掌握统计数学理论的主要目的是提供随机试验的数学模型,一旦提供了这种试验的模型并且详细阐述了理论,那么统计学家就可以在这个框架内对随机试验进行推断(即得出结论)。 这种模型的构建需要概率论,逻辑上满足概率的一个模型就是基于集合概念和集合函数的模型,下篇博文简单介绍一下集合论的相关知识。