统计推断是指,在数理统计中,我们研究的随机变量,其分布是未知的,或者是不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布做出种种推断。
一,随机样本
总体和个体 在数理统计中,研究对象是某一项数量指标(例如,学生的身高,体重等),对这一项数量指标进行观察。把试验的全部可能的观察值称为总体,每一个可能的观察值称为个体。
总体中的每一个个体是随机试验的一个观察值,因此,它是某一随机变量X的值。一个总体就对应一个随机变量X,对总体的研究就是对一个随机变量X的研究。
样本 在实际中,总体的分布一般是未知的,或只知道它具有某种形式而其中包含了未知参数。在数理统计中,人们都是通过从总体中抽取一部分个体,根据获得的数据对总体分布做出推断,被抽出的部分个体叫做总体的一个样本。
所谓从总体抽取一个个体,就是对总体X进行一次观察并记录观察结果。在相同的条件下对总体X进行n次重复的,独立的观察,把n次观察的结果按照试验的次序记为:X1,X2,...,Xn,
由于X1,X2,...,Xn是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,所以有理由认为X1,X2,...,Xn是相互独立的,且都与X具有相同分布的随机变量,把X1,X2,...,Xn 称为来自总体X的一个简单随机样本。
当n次观察一经完成,得到一组实数x1,x2,...,xn,它们依次是随机变量X1,X2,...,Xn的观察值,称为样本值。
样本 定义, 设X是具有分布函数F的随机变量,若 X1,X2,...,Xn 是具有同一分布函数F的,相互独立的随机变量,则称 X1,X2,...,Xn 为从分布函数F(或总体F,总体X)得到的简单随机样本,简称样本。它们的观察值 x1,x2,...,xn称为样本值,又称为X的n个独立的观察值。
若 X1,X2,...,Xn 为总体X的一个样本,则X1,X2,...,Xn相互独立,且它们的分布函数都是F(x),所以(X1,X2,...,Xn)的分布函数是:
白话:随机变量X1,X2,...,Xn同时发生的概率是单独发生的概率之积。
二,统计量
样本是进行统计推断的依据,在应用时,往往不是直接使用样本本身,而是针对不同的指标构造样本的适当函数(即统计量),利用统计量进行统计推断。
1,统计量的定义
定义 设X1, X2, ..., Xn是来自总体X的一个样本,g(X1, X2, ..., Xn)是样本X1, X2, ..., Xn的函数,若g中不含未知数,则称 g(X1, X