第六章 样本及抽样分布
内容提要
一、总体
在数理统计中,研究对象的全体称为总体,组成总体的每个元素称为个体。总体常用一个随机变量X表示。若X的分布函数为F(x),称F(x)为总体X的分布函数。
二、样本
设X是具有分布函数F(x)的随机变量,若是具有同一分布函数F(x)的相互独立的随机变量,则称为来自总体X的一个样本,样本容量为n。为的一组观测值,的联合分布函数为
F()=F()F()…..F()=
三、统计量
设是来自总体X的一个样本,g()是的函数,若是连续函数且g不含任何未知参数,则称g()是一个统计量。为的一组观测值,则称g ()是g()观测值。
四、常用统计量
1、样本均值 =
2、样本方差 ==
样本标准差 S=
3、 样本k阶(原点)矩 = k=1,2….
4、样本k阶中心矩 k=2,3….
五、常用统计量的分布
1、 的分布:设是来自总体N()的一个样本,则
N() ;
2.分布: 设x1,x2,…,xn是来自总体N(0,1)的样本,则统计量
=X12+X22+…+Xn2=
服从自由度为n的分布,记~.
1) 若x~,y~,x,y相互独立,则 x+y~
2) 若x~,则E(χ2)=n. D(χ2)=2n.
3) 设X1,X2,…,Xn是来自总体N(μ,σ2)的样本,,s2分别为样本均值与样本方差,则 ~; 与s2独立。
4) 设x~,的分位点满足条件
==, (0<<1)
3.t分布: x~N(0.1), y~,x与y相互独立,则称随机变量
t=
服从自由度为n的t分布,记 t~t(n).
1) 设x1,x2,…,xn是来自正态总体N(μ,σ2)的样本, ,s2分别为样本均值与样本方差,则 ~t(n-1)
2)设t~t(n),t(n)的分位点满足条件
p{t>}== , (0<<1)
3)设X1,X2,…,Xn1;Y1,Y2, …,Yn2分别是正态总体N(μ1,σ2)、N(μ2,σ2)的样本,且它们相互独立,则
~t,
其中:=,
,分别为两个正态总体的样本均值,,分别是两个正态总体的样本方差。
4.F分布:设x~,y~,且x,y相互独立,则称随机变量
F=
服从自由度为()的F分布,记 F~F()
1)设X1,X2,…,Xn1;Y1,Y2, …,Yn2分别是来自正态总体N,N的独立样本,,分别为两个正态总体的样本均值,,分别是两个正态总体的样本方差。则
F=~F,
特别时, F=~F.
2)设F~F(),F()的分位点满足条件
==,(0<<1).
基本要求
1、 理解总体,个体,样本和统计量的概念,掌握样本均值,样本方差及样本矩的计算。
2、 了解分布,分布,分布的定义及性质,了解分位点的概念并会查表计算。
3、 掌握正态总体的某些常用统计量的分布。
4、 了解,的分布。
本章重点:统计量的概念及其分布。
典型例题分析
例1. 设X1,X2,…Xn是来自总体X的一个样本,在下列三种情况下,分别求出 E(), D(), E(S2)。
(1)X~B(1,p); (2)X~Exp(λ); (3)X~U(0,θ);
分析:利用常用分布的期望,方差,以及,S2定义和期望方差性质,即可求解。
解:(1)由于X~B(1,P), E(X)=P, D(X)=P(1-P)。
所以 E()=EX=P,
D()=(1/n)*D(X)=P(1-P)/n,
E(S2)=P(1-P)
(2)由于X~Exp(λ), E(X)=λ, D(X)=λ2
所以 E()=λ
D()=(1/n)*D(X)=λ2/n,
E(S2)=λ2
(3)由于X~U(0,θ), E(X)=θ/2, D(X)=θ2/12
所以 E()=θ/2,
D()=θ2/(12n),
E(S2)=θ2/12
例2 、在总体N(7.6,4)中抽取容量为n的样本,如果要求样本的均值落在(5.6,9.6)内的概率不小于0.95,则n至少为多少?
分析:因为样本均值~N(7.6,4/n).将P(5.6<<9.6)进行求解变形,代为
P(a<(-7.6)/<b)形式,再利用标准正态分布查表可解出n
解:因为~N(7.6,4/n).所以
P(5.6<<9.6)=P{<(-7.6)/<}≥0.95
即 P{-<(-7.6)/<}≥0.95,
亦即 2Φ()-1≥0.95,Φ()≥0.975
由表Φ(1.96)=0.975,
故≥1.96或n≥3.84,即样本量n至少为4
例3 、由正态总体N(100,4)中抽取两个独立样本,样本均值分别为, ,样本容量分别为15,20。试求P(-|>0.2)
分析:先求出-的分布,再利用P(|-|>0.2)代为求标准正态分布在区间内的概率,即可求解
解:由于~N(100,4/15),~N(100,4/20),与独立
所以 ~,即~
于是
例4、 由正态分布抽取容量为的样本,试求
分析: 因为~,设法将恒等变形为,再求分布定义及查表即可求得
解: 因为 ~,~
所以 =
=
例5.设是来自的样本已知
求
分析:因为 ~,
,利用的恒等变形及分布定义,即可求得
解: 因为 ~
所以
例6. 设随机变量 ~
分析:.利用间关系可证
解: 因为
所以
又.
故有
例7.设来自N(0,)的样本。试求y=的分布。
分析:y==为两个正态分布的平方和之商。若能转化为两个分布之商,即可证明Y服从F分布。
解:因,
所以 ,。
由于 Cov(,)=D()-D()=0,
且与服从二元正态分布,故 ,独立。
于是, y==.
例8.设…来自N(,)的样本。=,为前n个样本的样本均值与样本方差。试求常数c。使 服从t分布,并指出分布的自由度。
解析:先求出-所服从的正态分布,再有~(n-1)
最后由t分布定义可求解。
解: 因为
所以
所以
即 时, ;
自由度为.
例9.设是来自.求下列概率.
(1) (2)
分析:利用,以及标准化正态分布,即可求解
解: =
.
例10.设在总体中抽取容量为16的样本,这里 已知。
1)。2)求
分析:因为这里的已知,故可求解1)
利用及分布方差即可求2)
解:1)因为 ,所以
=
2)因为 ~;
即 ;
故。
自测题
填空题
1.设随机变量和独立都服从正态分布,而和分别是来自总体和的样本,则统计量
服从分布,自由度为。
2.是来自正态总体的样本,
,
则当时,统计量服从分布,自由度为
3.设总体服从正态分布,而是来自总体的样本,则统计量
服从分布,自由度为。
选择题
1. 设是来自正态总体的样本,是样本均值,
则服从自由度为的分布的随机变量是( )
A) B)
C) D)
2.设总体服从正态分布,其中已知,未知,是的样本,则下列表达式中不是统计量的是( )
A) B) min ()
C) D)
解答题:
1.在天平上重复称量一重为a的物品,假设各次称重结果相互独立且同服从正态分布,若以表示n 次称量结果的算术平均,如果要求则n至少为多少?
2.设是来自正态总体的样本,求
。
3.设是来自正态总体的样本,
证明:统计量服从自由度为2的t分布。
4. (为正态总体的样本,样本均值,求统计量的数学期望。(提示:令,并利用
答案:
填空:(1)t,9 (2) 1/20, b=1/100, n=2 (3) F; (10,5)
选择:(1)B (2) C 解答:(1), (2) 0.2923
(3)先求的分布,在标准化,证明,再用t分布定义
(4)
from: http://lxy.cumtb.edu.cn/gailvtongjidaoxue/chap6.htm