抽样分布:经常听到的卡方分布、t分布等的含义是啥?

来源:首席数据科学家

「Python数据之道」导读

大家好,我是阳哥,相信大家经常听到卡方分布、t分布等概念,今天跟大家分享关于抽样分布的内容。

01

抽样分布

首先,什么是抽样分布呢?

在上篇文章中,我们介绍了统计量的概念(不含任何未知参数的样本的函数,就叫统计量),统计量的分布,就是抽样分布

抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。每种分布对应假设检验中的一种检验方法,后续讲假设检验的时候再详细讲解。因此这几种分布的知识是后续重要的基础。

关于正态分布大家都比较了解,因此重点阐述一下后面的三种分布。

02


卡方分布

先介绍一下卡方分布相关的内容。

(1)卡方分布的定义

定义:当 ,则以下的统计量(即样本取平方后求和):

服从自由度为n的分布,即卡方分布。记为:。这里的自由度,指的就是独立变量的个数,因此肯定是正整数。

(2)卡方分布的图像及特点

卡方分布的图像如下:

  • 当自由度是2的时候,比较特殊,刚好是指数分布。

  • 当自由度大于2的时候,卡方分布的曲线都是单峰曲线,在n-2处取得峰值。

  • 曲线关于x=n-2是不对称的,当n越大,峰向右移动;当n无限大时,可以用正态分布近似。

(3)卡方分布的相关定理

卡方分布的期望和方差有以下特点:

卡方分布具有可加性。当两个(或者多个)随机变量均服从卡方分布时,且相互独立,那么加和之后的分布也服从卡方分布,自由度是两个自由度之和,即:

关于卡方分布,就主要介绍这些。

03


t分布

接下来我们介绍一下t分布。

(1)t分布的定义

定义:当 , Y服从自由度是n的卡方分布,且X、Y相互独立,则以下的统计量


服从自由度为n的t分布。因此,t分布是由标准正态分布和卡方分布构造的分布。

(2)图像及特征

t分布的图像如下:

t分布是具有对称性的。

04


F分布

最后我们介绍一下F分布。

(1)F分布的定义

定义:当,且U、V相互独立,则以下的统计量

服从自由度为  的F分布。这里的两个自由度是有先后顺序关系的。因此,如果互换一下分子分母,很容易得出结论:

从上面很容易了解到,F分布是由两个卡方分布构造的。

(2)F分布的图像

F分布的图像如下:

05


正态总体下的抽样分布

几个重要的分布讲完了,最后我们再介绍一下在总体是正态分布的前提下,常用统计量的分布规律。再强调一下,下面的规律都是基于总体服从正态分布的前提,这里只需要总体是正态分布即可,不需要是标准正态分布

以下的这几个抽样分布还是很重要的,后续做区间估计的时候会用到这几个构造枢轴变量,用以进行总体参数估计。

(1)关于样本均值的分布

样本均值经过以下标准化后,服从标准正态分布。


即样本均值的期望等于总体期望,样本均值的方差是总体方差的n分之一。

若将分母中的总体标准差改为样本标准差,则服从自由度为n-1的t分布:

这两个不同处理之下的不同分布,还是需要注意一下。

(2)关于样本方差的分布

样本方差乘以系数后,服从自由度为n-1的卡方分布:

需要注意的是,这里的自由度是n-1,因为这里样本方差是用每个样本减去样本均值。如果改为减去总体均值,其他内容不变,则服从自由度为n的卡方分布。因为样本均值多了一个约束(均值公式),因此自由度少了一个。

(3)关于样本均值和样本方差的关系

样本均值和样本方差相互独立。

(4)两个正态总体时,两样本的关系

上面讲到的几个都是在单个正态总体的情况下。当有两个正态总体时,两个样本的方差和两个总体方差有以下分布:

即处理后的分布服从F分布。

另外,一种特殊情况下,当时,

其中,

关于卡方分布、t分布、F分布相关的内容就先分享到这里,欢迎继续关注~

  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值