1.2数理统计中的基本概念(续)
上一讲中提到了总体分布族的概念,这里补充样本分布族的概念。
设总体来自分布族
![]()
,那么从中抽取的一组简单随机样本
![]()
的分布一定是
![]()
中的一员,这个分布族就称为
样本分布族。而统计实际上也就是由样本推断总体的过程,因此这样一个分布族是统计推断的出发点,也被称为
统计模型。事实上对于简单随机样本,一旦总体分布族
![]()
确定,样本分布族也就随之确定,因此有时我们也把简单随机抽样的总体分布族称为统计模型,但对于非简单随机抽样而言,我们只称样本分布族为统计模型。
1.2.5样本认识总体
统计学做的事情就是从总体中选样本,然后由这些样本来作为总体信息的一个替代。可是这样做是否有道理呢?为了说明这一点,我们先给出经验分布函数的定义:
定义 对于样本
![]()
,我们将其经验分布函数(empirical distribution function)定义为
![]()
其中
![]()
表示集合
![]()
中的元素个数。此外经验分布函数还有以下两个等价形式:
![]()
其中
![]()
,是样本
![]()
从小到大排列得到的,也称之为次序统计量,关于次序统计量,我们在第二章还会重点学习。
对于上述定义的经验分布函数,我们不难验证它具有以下性质:
(1)
![]()
为
![]()
的单调非降左连续函数
(2)
这其实也是分布函数的性质,在概率论中我们有提到,当一个函数具有分布函数的这两个性质时,它一定是某个随机变量的分布函数,事实上我们能写出这个随机变量的分布列如下:
![]()
基于经验分布的第二种形式