1 样本均值的采样分布
- 如果样本是从正态分布中采样得到的(population distribution 为正态分布),那么对于任何大小的n,样本均值都是正态分布
- 如果样本不是从正态分布中采样得到的,但是它的均值和方差已知(population distribution 不是正态分布,但是均值和方差为)。如果样本数量n很大的话(n≥30),那么样本均值可以被近似为正态分布
如果样本是从正态分布中采样得到的(population distribution 为正态分布),但是未知,且n较小(小于30) ,那么 样本均值可以被近似为n-1自由度的t-分布
关于如何判断是否为正态分布:可以通过使用QQ图判断
1.0.1 t分布形式的证明:
证明t分布的话,我们需要知道样本数据以下几个条件
- ——>
同时t分布的定义为:
于是我们有:
为自由度是n-1的t分布,化简之后有满足自由度为n-1的t分布
1.1 中心极限定理
对于上述的第二种情况,我们称之为中心极限定理central limit theorem (CLT)
通过图例我们可以看出,随着样本变多,样本均值的分布逐渐向正态分布转变(n=1就是样本本身的分布,可以看出来和正态分布有很大的出入)
2 样本均值之差的分布
从分布,中独立采样n1和n2,如果
(1)分布1和分布2的population distribution均为已知σ的正态分布
或者
(2)n1和n2都很大(大于30)
那么二者的均值之差可以被近似为一个正态分布,其中:
即:
(3)分布1和分布2的population distribution均为不知道σ的正态分布,且样本数量不多,那么可以使用t分布
2.1 第一和第二小节的总结
如果样本数量多的时候,我们不知道population 的方差,我们可以用样本方差近似之
3 二项分布采样样本的样本概率分布
对于二项分布X~b(x;n,p),我们知道E(X)=np,同时V(X)=np(1-p)
当样本n很大,同时p不是很大也不是很小的时候 (np>5,n(1-p)>5),我们可以用正态分布来近似样本的二项分布
而如果我们分式上下同时除以n,就得到了样本概率分布
4 正态分布样本的样本方差分布
对于正态分布中采样的样本X,(population distribution为方差为的正态分布),如果样本数量为n,那么
的分布为自由度为n-1的chi-square分布
4.1 证明
首先,对于样本,我们有:
然后对上式左右进行变换,有:
我们令,那么 (注: 并不是N(0,1),不能在上一行中直接用chi-square分布的定义)
将代入,有:
是自由度为n的chi-square 分布
而对于 ,我们先看的分布
所以~N(0,1),可以看作是自由度为1的chi-square分布
所以 是自由度为n-1的chi-square分布
5 样本方差比值的分布
5.1 推导
通过条件我们知道
F分布的定义为
那么
是自由度为n1-1,n2-1的F分布
6 样本估计的标准
6.1 无偏性
s1是无偏估计,s2是有偏估计
6.2 有效性 efficient
看的是它的“范围”
6.3 持续性 consistent
翻译一下就是样本量越大,范围越narrow