数理统计中的卡方分布，t分布和F分布

最新推荐文章于 2025-03-28 17:11:30 发布

spic_jackmaster

最新推荐文章于 2025-03-28 17:11:30 发布

阅读量9.7k

点赞数 4

分类专栏：数理统计文章标签：数据统计三大分布卡方分布 t分布 F分布

原文链接：https://blog.csdn.net/anshuai_aw1/article/details/82735201

版权

数理统计专栏收录该内容

2 篇文章

订阅专栏

本文深入探讨了统计学中的三大抽样分布——卡方分布、t分布和F分布，详细介绍了它们的定义、性质及其在正态总体样本均值和样本方差分布中的应用。文章还讲解了如何基于这些分布进行区间估计和假设检验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有很多统计推断是基于正态分布的假设，以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用，这是因为这三个统计量不仅有明确背景，而且其抽样分布的密度函数有显式表达式，它们被称为统计中的“三大抽样分布”。这三大抽样分布即为著名的卡方分布，t分布和F分布。

1 卡方分布

1.1 定义

设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为

$\Gamma(\cdot )$ 表示的是一个gamma函数，它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结。

$\chi _{n}^{2}$ 的密度函数 $g_{n}(x)$ 形状如下图

$\chi _{n}^{2}$ 密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), 从上图可见当自由度 n 越大, $\chi _{n}^{2}$ 的密度曲线越趋于对称, n
越小, 曲线越不对称. 当 n = 1, 2 时曲线是单调下降趋于 0. 当 n ≥ 3时曲线有单峰, 从 0 开始先单调上升, 在一定位置达到峰值, 然后单下降趋向于 0。

若 X ∼ $\chi _{n}^{2}$ , 记 $P(x> c)=\alpha$ ，则 $c=\chi _{n}^{2}(\alpha )$ 称为 $\chi _{n}^{2}$ 分布的上侧 $\alpha$ 分位数, 如下图所示。当 $\alpha$ 和给定时可查表求出 $\chi _{n}^{2}(a)$ 之值，如 $\chi _{10}^{2}(0.01)=23.209$ ， $\chi _{5}^{2}(0.05)=12.592$ 等。

1.2 性质

χ2 变量具有下列性质:

2 t分布

说起t分布，首先要提一句u分布，正态分布（normal distribution）是许多统计方法的理论基础。正态分布的两个参数μ和σ决定了正态分布的位置和形态。为了应用方便，常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u，以使原来各种形态的正态分布都转换为μ=0，σ=1的标准正态分布（standard normaldistribution）,亦称u分布。根据中心极限定理，通过抽样模拟试验表明，在正态分布总体中以固定 n 抽取若干个样本时，样本均数的分布仍服从正态分布，即N（μ，σ）。所以，对样本均数的分布进行u变换，也可变换为标准正态分布N (0,1)。

由于在实际工作中，往往σ(总体方差)是未知的，常用s（样本方差）作为σ的估计值，为了与u变换区别，称为t变换，统计量t 值的分布称为t分布。

2.1 定义

设随机变量 T ∼ $t_{n}$ , 则其密度函数为

该密度函数的图形如下

$t_{n}$ 的密度函数与标准正态分布 N(0, 1) 密度很相似, 它们都是关于原点对称, 单峰偶函数, 在 x = 0 处达到极大. 但 $t_{n}$ 的峰值低于
N(0, 1) 的峰值, $t_{n}$ 的密度函数尾部都要比 N(0, 1) 的两侧尾部粗一些. 容易证明:

此处 $\varphi (x)$ 是 N(0, 1) 变量的密度函数。

若T ∼ $t_{n}$ ，记 $P(\left | T \right |> c)=\alpha$ ，则 $c={t_{n}}(\alpha /2)$ 为自由度为n的t分布的双侧 $\alpha$ 分位数(如上图所示). 当给定 $\alpha$ 时, ${t_{n}}(\alpha )$ , ${t_{n}}(\alpha /2)$
等可通过查表求出. 例如 ${t_{12}}(0.05)=1.782$ ， ${t_{9}}(0.025)=2.262$ 等。

t 分布是英国统计学家 W.S. Gosset 在 1908 年以笔名 Student发表的论文中提出的, 故后人称为 “学生氏 (Student) 分布” 或 “t 分
布”。

2.2 性质

t 变量具有下列的性质:

3 F分布

3.1 定义

若随机变量 Z ∼ $F_{m,n}$ , 则其密度函数为

自由度为 m, n 的 F 分布的密度函数如下图：

注意 F 分布的自由度 m 和 n 是有顺序的, 当 $m\neq n$ 时, 若将自由度 m 和 n 的顺序颠倒一下, 得到的是两个不同的 F 分布. 从上图
可见对给定 m = 10, n 取不同值时 $f_{m,n}(x)$ 的形状, 我们看到曲线是偏态的, n 越小偏态越严重。

若 F ∼ $F_{m,n}$ , 记 $P(F> c)=\alpha$ , 则 $c=F_{m,n}(\alpha )$ 称为 F 分布的上侧 $\alpha$ 分位数 (见上图). 当 m, n 和 $\alpha$ 给定时, 可以通过查表求出
$F_{m,n}(\alpha )$ 之值, 例如 $F_{4,10}(0.05)=3.48$ , $F_{10,15}(0.01)=3.80$ 等. 在区间估计和假设检验问题中常常用到.

3.2 性质

F 变量具有下列的性质:

以上性质中 (1) 和 (2) 是显然的, (3) 的证明不难. 尤其性质 (3)在求区间估计和假设检验问题时会常常用到. 因为当 α 为较小的数,
如 α = 0.05 或 α = 0.01, m, n 给定时, 从已有的 F 分布表上查不到 $F_{m,n}(1-0.05)$ 和 $F_{m,n}(1-0.01)$ 之值, 但它们的值可利用性质(3) 求得, 因为 $F_{n,m}(0.05)$ 和 $F_{n,m}(0.01)$ 是可以通过查 F 分布表求得的.