1、总体:研究对象的全体X。
2、个体:组成总体的每一个元素。
3、简单抽样:从总体X中抽出X1,...,Xn个体。
代表性:样本与总体同分布,各个体抽到的机会均等。
独立性:各样本元素相互独立,抽出样本后,总体元素近似不变。
4、样本:简单抽样对应的随机向量(X1,...,Xn)为总体X的一个样本,其所有可能的取值的集合为样本空间,每次抽样所得的具体数值(x1,...,xn)为样本观察值(样本点),n为样本容量。
5、统计量:不含未知参数的样本函数g(X1,...,Xn),g(x1,...,xn)为其观察值,统计量也为随机变量。
样本均值:∑(Xi)/n
样本方差:S^2=∑(Xi-样本均值)^2/(n-1)
6、抽样分布:统计量的分布叫做抽样分布,由于统计量是样本的函数,而样本与总体同分布,且相互独立,故统计量的分布由样本的联合分布Π(联合分布函数(连乘))唯一确定,即由总体分布唯一确定。
7、Z分布:将正态分布化成标准正态分布。
8、卡方分布x^2(n): 标准正态分布样本的平方和。
9、T分布:对标准正态分布X,卡方分布Y,T=X/sqrt(Y/n)
10、点估计(定植估计):由估计量的观察值作为未知参数的估计值。
11、区间估计:估计未知参数所在的一个范围,并指出参数被包含在改范围内的概率。
12、点估计的方法:
顺序估计: 样本中位数及样本极差
距估计(数字特征法):样本均值估计总体的均值;样本方差估计总体的方差
极大似然估计法:根据“概率最大的事件最可能发生”
设总体X的概率密度函数f(x,θ)只含一个未知参数θ,(X1,...,Xn)为总体X的一个样本,(x1,...,xn)为样本的一组观察值,样本的联合概率密度
Πf(xi,θ)=L(x1,...,xn,θ)=L(θ)称为似然函数。
当θ已知时,似然函数L描述了样本取得观察值(x1,...,xn)的可能性,“最可能出现”的样本观察值是使得似然函数L达到极大值的样本值。同样,当一组样本观察值取定 时(抽样完成),要问它最大可能取自什么样的总体(即总体的参数θ应等于什么时的可能性最大),也要从似然函数L=L(θ)的极大化中求出相应的θ值来,这个值就是θ的一个估计值。
max L(x1,...,xn,θ)可得到θ的极大似然估计值。可对L或者ln(L)求导=0得到。
13、点估计的优劣标准:
无偏性:估计量的数学期望=估计量对应的待估计未知参数
有效性:估计量的方差越小越有效
一致性:估计量依概率收敛于其对应的待估计未知参数
14、参数的区间估计
15、统计假设H:关于总体X的分布(或随机事件的概率)的各种论断。
16、显著性水平:
17、假设检验的步骤:
18、Z检验:若总体X遵从正态分布N(μ,σ^2),其中σ^2已知,统计量Z准从标准正态分布,按标准正态分布进行显著性检验。
19、T检验:若总体X遵从正态分布N(μ,σ^2),其中σ^2未知,用σ^2的无偏统计量样本方差S^2来代替,于是选取统计量T,服从自由的为n-1的T分布。
20、x^2卡方检验:单正态总体方差的检验法
21、F检验:二正态总体方差比的检验法
22、总体分布函数的假设检验
卡方检验法的基本原理和步骤