第五章数理统计--样本和抽样分布

从今天开始要学习数理统计。
概率论:是专门研究随机现象的一门学科,定量描述随机现象及其规律。
数理统计:数理统计的研究对象是数据,包括对数据的采集、整理、分析、建模。主要任务是获取样本、描述样本,从样本得到总体的分布情况和分布参数。

基本概念

 总体:研究对象的全体。
 个体:总体中的成员。
 总体的容量:总体中包含的个体数。
 有限总体:容量有限的总体。
 无限总体:容量不可数的总体。有限总体量非常大的时候,也看作是无限总体。
 总体的某个指标X,对于不同个体,有不同的值。X可以看做是随机变量。假设X的分布函数为F(X),也称总体X具有分布函数F(X)。

数据收集

 数据收集方法有两种。1 调查记录,例如是否做过家教。2 试验记录。例如药物反应。

抽样

 数理统计的目标是从样本推总体。使用的方法是抽样。
 样本:从总体中抽取到的部分个体叫样本。
 简单随机样本:满足以下两个条件的随机样本( X1,X2...Xn )称为容量为n的简单随机样本:1 每个 Xi 与X同分布;2 X1,X2...Xn 是相互独立的随机变量。详细解释第一个条件。一批灯泡的寿命服从 π(λ) 。这个总体中任何一个样本的寿命都是服从 π(λ) ,所以任意抽取一个就可以。如果这里面混入了别人家的产品,这个产品服从 π(λ1) ,那这个抽样就要出问题了。或者这里混入了IBM笔记本。笔记本寿命可能就不符合泊松分布了。
 一个容量为n的样本 X1,X2...Xn 是指n个独立的与总体分布相同的随机变量。
 样本观察值:对样本进行一次观察,得到实际的值。
 抽样分不放回抽样、放回抽样。
 统计量:样本的不包含任何未知参数的函数。
 样本均值: X¯¯¯=1nni=1Xi
 样本方差: S2=1n1ni=1(XiX¯¯¯)2
 标准差: S=S2
 k阶矩: Ak=1nni=1Xki
 k阶中心矩: Bk=1nni=1(XiX¯¯¯)k
  B2=n1nS2

样本分位数

 样本p分位数:1至少有np个观察值小于等于 xp ;2 至少有n(1-p)个观察值大于等于 xp 。(0 < <script type="math/tex" id="MathJax-Element-16"><</script>p<1)。样本中位数M、第一四分位数 Q1 、第三四分位数 Q3
 例如:一组容量为18的样本值如下:
 122 126 122 140 145 149 150 157
 162 166 175 177 183 188 199 212
  x0.2=x(n0.2)=x([180.2]+1)=x([3.6]+1)=x4=140
  x0.25=x(n0.25)=x([180.25]+1)=x([4.5]+1)=x5=145
  x0.5=? :18*0.5=9; x0.5=12(157+162)=159.5
 箱线图:最小值Min,第一四分位数 Q1 、样本中位数M、第三四分位数 Q3 、样本最大值Max,五个数据画成的图。

重要的抽样分布

 统计量的分布称为抽样分布。
 几个重要的抽样分布:正态分布、卡方分布、t分布、F分布。

卡方分布

 定义:设随机变量 X1,...Xn 相互独立,且都服从N(0,1),则称 =ni=1X2i 服从自由度为n的卡方分布。
 概率密度函数:
 性质:
 1 E(卡方分布)=n,D(卡方分布)=2n。
 2 可加性。 Y1 (n1) Y2 (n2) ,且 Y1,Y2 相互独立,则 Y1+Y2 (n1+n2)
 上 α 分位数

t分布

 定义:设随机变量X~ N(0,1) ,Y~卡方分布(n),X与Y相互独立,则称变量 T=XY/n 服从 t(n)。
 概率密度函数:
 上 α 分位数

F分布

 定义:设随机变量X~ (n1) ,Y~卡方分布( n2 ),X与Y相互独立,则称变量 F=X/n1Y/n2 服从 F(n1,n2)
 概率密度函数:
 性质:
 1 如果 FF(n1,n2) ,则 1F ~ F(n2,n1) .
 上 α 分位数
  

单个正态总体的抽样分布

 设总体X的均值为 μ ,方差为 σ2 X1,X2,...Xn 是来自X的一个样本,样本均值 X¯¯¯=1nni=1Xi ,样本方差 S2=1n1ni=1(XiX¯¯¯)2 ,则有 E(X¯¯¯)=μ D(X¯¯¯)=σ2n E(S2)=σ2
 
 定理一:总体 X ~N(μ,σ2) X1,X2,...Xn 是样本,样本均值 X¯¯¯=1nni=1Xi ,样本方差 S2=1n1ni=1(XiX¯¯¯)2 ,则
 
 (1) X¯¯¯N(μ,σ2n)
 (2) (n1)S2σ2 ~卡方分布(n-1), S2 X¯¯¯ 相互独立。
 定理二:总体X~ N(μ,σ2) X1,X2,...Xn 是样本,样本均值 X¯¯¯=1nni=1Xi ,样本方差 S2=1n1ni=1(XiX¯¯¯)2 ,则 X¯¯¯μS/n ~t(n-1)

两个正态总体的抽样分布

 定理三:设样本( X1,X2...Xn )和( Y1,Y2...Yn )分别来自总体 N(μ1,σ21) N(μ2,σ22) ,并且它们相互独立,样本均值分别为 X¯¯¯ Y¯¯¯ ;样本方差分为别 S21 S22 ,则可以得到以下抽样分布:
 1 F=S21/σ21S22/σ22=S21/S22σ21/σ22 ~ F(n11,n21)
 
 2 (X¯¯¯Y¯¯¯)σ21n1+σ22n2N(0,1)
 3 当 σ21=σ22=σ2 时, (X¯¯¯Y¯¯¯)Sw1n1+1n2t(n1+n22) ,其中 S2w=(n11)S21+(n21)S22n1+n22 Sw=S2w

总结

1 设样本 X1,X2...Xn 是来自总体X的样本,不管X服从什么分布,只要期望和方差存在,具有 E(X)=μ D(X)=σ2 ,则有 E(X¯¯¯)=μ D(X¯¯¯)=σ2n
2 总体 X ~N(μ,σ2) X1,X2,...Xn 是样本,样本均值 X¯¯¯=1nni=1Xi ,样本方差 S2=1n1ni=1(XiX¯¯¯)2 ,则
 
 (1) X¯¯¯N(μ,σ2n)
 (2) (n1)S2σ2 ~卡方分布(n-1)
 (3) S2 X¯¯¯ 相互独立。
 (4) X¯¯¯μS/n ~t(n-1)
3 对于两个正态总体,有三条重要的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值