1)中心极限定理
设随机变量序列X1,X2,…Xn,…相互独立,均具有相同的数学期望与方差,且E(Xi)= Ui,D(Xi)=Ri^2>0,i=1,2,…,令:
Yn=X1+X2+…+Xn
Zn=〔Yn-E(Yn)〕/√D(Yn)=∑(Xi-Ui)/√∑Ri^2 (i=1,2…、n)
则称随机变量Zn为随机变量序列X1,X2,…Xn的规范和。
中心极限定理:设从均值为μ、方差为
σ
2
σ^2
σ2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。
独立同分布的中心极限定理
设随机变 量X1,X2,…Xn,…独立同分布,并且具有有限的数学期望和方差:E(Xi)=μ,D(Xi)=σ20(k=1,2…),则对任意x,分布函数
满足
该定理说明,当n很大时,随机变量 近似地服从标准正态分布N(0,1)。因此,当n很大时, 近似地服从正态分布N(nμ,nσ2).该定理是中心极限定理最简单又最常用的一种形式,在实际工作中,只要n足够大,便可以把独立同分布的随机变量之和当作正态变量。这种方法在数理统计中用得很普遍,当处理大样本时,它是重要工具
2)置信区间
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的"一个概率"。
这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95以上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之2.5。 如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信空间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,显著性水平越高,所对应的置信区间就会越大。
Pr(c1<=μ<=c2)=1-α
α是显著性水平(例:0.05或0.10)
100%*(1-α)指置信水平(例:95%或90%)
表达方式:interval(c1,c2)–置信区间。