概率论与数理统计-第五章 数理统计的基础知识

第五章 数理统计的基础知识

由于大量随机现象必然呈现出它的规律性,故理论上只要对随机现象进行足够多次的观察,研究对象的规律性就一定能清楚地呈现出来,但实际上人们常常无法对所研究的对象的全体(或总体)进行观察,而只能抽取其中的部分(或样本)进行观察或试验以获得有限的数据.

  • 总体、样本、样本值三个概念
    总体 X 是一个分布完全未知或者部分未知的随机变量,是数理 统计的研究对象。
    由于抽样的随机性,容量为 n 的样本实际上是 n 个随机变量 X1 …Xn,它们相互独立,且都与总体 X 同分布。样本也叫简单随机 样本。
    样本值是指在一次抽样中得到的 n 个具体的观察值x1 …xn

5.1 数理统计的基本概念

一、总体与总体分布

在数理统计中,把研究的问题所涉及的对象的全体所组成的集合称为总体(或母体).把构成总体的每一个成员(或元素)称为个体.总体中所包含的个体的数量称为总体的容量.容量为有限的称为有限总体;容量为无限的称为无限总体.总体与个体之间的关系,即集合与元素之间的关系
定义1:统计学中称随机变量(或向量)X为总体,并把随机变量(或向量)的分布称为总体分布

二、样本与样本分布

  • 一般的方法是按一定原则从总体中抽取若干个个体进行观察,这个过程叫做抽样.显然,对每个个体的观察结果是随机的,可将其看成是一个随机变量的取值,这样就把每个个体的观察结果与一个随机变量的取值对应起来了.于是,我们可记从总体X中第i次抽取的个体指标为Xi(i=1,2,n)则Xi是一个随机变量;记xi(i=1,2,…,n)为个体指标Xi的具体观察值,我们称X1,X2,…,Xn为总体X的 样本 ;称样本观察值x1,x2,…,xn样本值 ;样本所含个体数目称为样本容量(或样本大小)。
  • 为了使抽取的样本能很好地反映总体的信息,除了对样本容量有一定的要求外还对样本的抽取方式有一定的要求,最常用的一种抽样方法称为简单随机抽样.它要求抽取的样本满足下面两个条件
    (1)代表性:X,X2,…,Xn与所考察的总体具有相同的分布;
    (2)独立性:X1,X2,…,Xn,是相互独立的随机变量.
    简单随机抽样得到的样本称为简单随机样本,它可用与总体同分布的n个相互独立的随机变量X1,X2,…,Xn表示,显然,简单随机样本是一种非常理想化的样本,在实际应用中要获得严格意义下的简单随机样本并不容易.

六、统计量

  • 定义3:设X,X2,Xn为总体X的一个样本,称此样本的任一不含总体分布未知参数函数为该样本的统计量
  • 例如,设总体X服从正态分布,E(X)=5,D(X)=σ22未知.X1,X2,Xn,为总体X的一个样本,令
    Sn=X1+X2+…+Xn,在这里插入图片描述
    则Sn,与¯X均为样本X1,X2,…,Xn,的统计量.但U=nμ(¯X-5)/σ不是该样本的统计量,
    因其含有总体分布中的未知参数μ,σ,

七、常用统计量

以下设X1,X2,…,Xn为总体X的一个样本.

  • 1.样本均值

在这里插入图片描述

  • 2.样本方差
    未修正的样本方差
    在这里插入图片描述在这里插入图片描述
    修正的样本方差
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

3.样本标准差

在这里插入图片描述

4.样本(k阶)原点矩

在这里插入图片描述
一节原点矩就是样本均值

5.样本(k阶)中心矩

在这里插入图片描述
其中样本二阶中心矩
在这里插入图片描述
又称作未修正样本方差.
注:上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显函数它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本(k阶)原点矩、样本(k阶)中心矩.

5.2 常用的统计分布

一、分位数

  • 设随机变量X的分布函数为F(x),对给定的实数α(0<α<1),若实数Fα。满足
    P(X>Fα)=α,
    则称Fα为随机变量X分布的水平的上侧分位数.
    若实数Tα/2满足
    P{|X|>Tα/2}=α,
    则称Tα/2为随机变量X分布的水平α的双侧分位数.
    在这里插入图片描述

  • 在这里插入图片描述
    注:今后分别记4。与42为标准正态分布的上侧分位数与双侧分位数,

  • 由P(X>Fα)=α,及其密度函数是偶函数得
    μ1-α=-μα

二、 x x x2分布

  • 定义1:设X1,X2,…,Xn是取自总体N(0,1)的样本,称统计量
    x x x2=X12+X22+…+Xn2 (2.1)
    服从自由度为n的 x x x2分布 ,记为 x x x2~ x x x2(n)
    这里,自由度是指式(2.1)右端所包含的独立变量的个数
    在这里插入图片描述
  • 在这里插入图片描述
    在这里插入图片描述

三、t分布

小样本一般是指n<30,(n>30,t分布与正态分布相似).t分布适用于当总体标准差未知时,用样本标准差代替总体标准差,由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等

  • 定义2设X~ N(0,1),Y~ x x x2(n),且X与Y相互独立,则称
    在这里插入图片描述
    服从自由度为n的t分布,记为T~t(n).t(n)分布的概率密度为
    在这里插入图片描述(偶函数)
  • 在这里插入图片描述
  • 由t(n)分布的概率密度为偶函数得
    t1-α(n)=-tα(n)

四、F分布

主要用于方差分析、协方差分析和回归分析等.

  • 定义3:设X~ x x x2(m),Y~ x x x2(n) ,且X与Y相互独立,则称
    在这里插入图片描述
    服从自由度为(m,n)的F分布,记为F~F(m,n).

  • F(m,n)分布的概率密度为
    在这里插入图片描述

  • 密度函数f(x) 的图形见图5-2-5.
    在这里插入图片描述

  • F分布具有如下性质
    (1)若X~ t(n),则X2~F(1,n)
    (2)若F~F(m,n),则
    1/F~F(n,m).
    (3)F分布的分位数:
    设F~F(n,m),对给定的实数α(0<α<1),称满足条件
    在这里插入图片描述
    的数Fα(n,m)为F(n,m)分布的水平α上侧分位数,如图5-2-6所示.F分布的侧分位数可从附表6中查得在这里插入图片描述

  • 在这里插入图片描述

  • F1-α(n,m)=1/Fα(m,n)
    由P(X>Fα)=α,证
    在这里插入图片描述
    在这里插入图片描述

  • 性质

    • μ1-α=-μα
    • t1-α(n)=-tα(n)
    • F1-α(n,m)=1/Fα(m,n)

5.3抽样分布(第六章基础)

  • 定理1设总体X~N(μ,o2),X1,X2,…,Xm是取自X的一个样本,¯X为该样本的样本均值,则有
  • 在这里插入图片描述
  • 定理2设总体X~N(μ,σ2),X1,X2,…,Xn是取自X的一个样本,¯X与S2分别为该样本的样本均值与样本方差,则有
    在这里插入图片描述
    (1) x x x2的自由度为n-1,因为X1-¯X+X2-¯X+…+Xn-¯X=0,则第n个变量可以由前n-1个求得,故只有n-1个独立变量,即自由度为n-1.在这里插入图片描述
  • 定理3设总体X~N(μ,σ2),X1,X2,…,Xn是取自X的一个样本,¯X与S2分别为该样本的样本均值与样本方差,则有
    在这里插入图片描述
    在这里插入图片描述
    (1)Xi相互独立,则Xi的函数也相互独立
    (2)t分布是标准正态分布/√(卡方分布/n)
    由定理2(2)可以得独立
    在这里插入图片描述
    在这里插入图片描述
    注:μ是总体均值,¯X是样本均值
  • 31
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值