三大抽样分布：卡方分布、t分布、F分布

最新推荐文章于 2022-07-03 21:47:38 发布

YMWM_

最新推荐文章于 2022-07-03 21:47:38 发布

阅读量859

点赞数

分类专栏： SLAM杂项文章标签：概率论

本文链接：https://blog.csdn.net/YMWM_/article/details/125141321

版权

SLAM杂项专栏收录该内容

15 篇文章 3 订阅

订阅专栏

1 卡方分布

设随机变量 $X_1,X_2,\cdots,X_n$ 相互独立，都服从标准正态分布 $N (0, 1)$ ，则随机变量 $X^2=X_1^2+X_2^2+\cdots+X_n^2$ 服从自由度为 $n$ 的 $\chi^2$ 分布，记作 $X^2\sim \chi^2(n)$ 。

$\chi^2(n)$ 分布的概率密度函数为
$f(x)=\begin{cases} \frac{1} {2^{\frac{n}{2}} \Gamma(\frac{n}{2})} x^{\frac{n}{2}-1}e^{-\frac{x}{2}}, x>0 \\ \\ 0, \ \ \ \ \ \ x \leq 0 \end{cases}$

设 $X_1^2\sim \chi^2_1(n_1)$ ， $X_2^2\sim \chi^2_2(n_2)$ ，并且 $X_1^2$ 和 $X_2^2$ 互相独立，则 $X_1^2+X_2^2\sim \chi^2(n_1+n_2)$ .

如果 $X^2\sim \chi^2(n)$ ，则有 $E(X^2)=n$ ， $D(X^2)=2n$ 。

运行如下代码，绘制自由度从1到20的卡方分布的概率密度函数曲线图，

clear all
clc
close all

%%
x=0:0.1:40;
y = chi2pdf(x,1);
plot(x, y)
xlim([0,40])
ylim([0,0.6])
grid on
hold on
for n = 2:20
    y = chi2pdf(x,n);
    plot(x, y)
end
legend('df=1', 'df=2', 'df=3', 'df=4', 'df=5', 'df=6', 'df=7', 'df=8', 'df=9', 'df=10', ...
'df=11', 'df=12', 'df=13', 'df=14', 'df=15', 'df=16', 'df=17', 'df=18', 'df=19', 'df=20');
title('不同自由度的卡方分布的概率密度函数')
xlabel('自变量X')
ylabel('概率Y')

在这里插入图片描述

2 t分布

设随机变量 $X, Y$ 相互独立，且 $X\sim N(0,1)$ ， $Y\sim \chi^2(n)$ ，则随机变量 $t=\frac{X}{\sqrt{Y/n}}$ 服从自由度为 $n$ 的 $t$ 分布，记作 $t\sim t(n)$ 。

$t (n)$ 分布的概率密度函数
$f(x)=\frac{\Gamma(\frac{n+1}{2})} {\sqrt{n \pi} \Gamma(\frac{n}{2}) } \Big(1+ \frac{x^2}{n} \Big)^{-\frac{n+1}{2}}, \ \ \ \ -\infty < x < +\infty$

$t (n)$ 分布的概率密度函数 $f (x)$ 是偶函数，且有 $\underset{n\rightarrow \infty}{lim} f(x) =\frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$ ，即当 $n$ 充分大时， $t (n)$ 分布近似 $\mathcal{N}(0,1)$ 分布。

运行以下代码，绘制不同自由度的 $t$ 分布的概率密度函数曲线图，

clear all
clc
close all

%%
x=-5:0.1:5;
y = tpdf(x,1);
plot(x, y)
xlim([-5,5])
ylim([0,0.4])
grid on
hold on
for n = 2:10
    y = tpdf(x,n);
    plot(x, y)
end
legend('df=1', 'df=2', 'df=3', 'df=4', 'df=5', 'df=6', 'df=7', 'df=8', 'df=9', 'df=10');
title('不同自由度的t分布的概率密度函数')
xlabel('自变量X')
ylabel('概率Y')

在这里插入图片描述

3 F分布

设随机变量 $X, Y$ 互相独立，且 $X\sim \chi^2(m)$ ， $Y\sim \chi^2(n)$ ，则随机变量 $F=\frac{X/m}{Y/n}$ 服从自由度为 $(m, n)$ 的 $\mathcal{F}$ 分布，记作 $F\sim \mathcal{F}(m,n)$ ，其概率密度函数为
$f(x)=\begin{cases} \frac{ \Gamma(\frac{n+m}{2}) }{ \Gamma(\frac{m}{2}) \Gamma(\frac{n}{2}) } (\frac{m}{n}) (\frac{m}{n}x)^{\frac{m}{2}-1} (1+\frac{m}{n}x)^{-\frac{n+m}{2}}, \ \ \ x\geq 0 \\ \\ 0, \ \ \ \ x < 0 \end{cases}$

设 $F\sim \mathcal{F}(m,n)$ ，则 $\frac{1}{F}\sim \mathcal{F}(n,m)$ 。

运行以下代码，绘制不同自由度的 $F$ 分布的概率密度函数曲线图，

clear all
clc
close all

%%
x=0:0.1:10;
y1 = fpdf(x, 10, 40);
y2 = fpdf(x, 11, 3);
plot(x, y1, x, y2)
grid on
legend('fd=(10,40)','fd=(11,3)')
title('不同自由度的F分布的概率密度函数')
xlabel('自变量X')
ylabel('概率Y')
xlim([0,10])

在这里插入图片描述

4应用

4.1 一个正态总体

设 $X_1,X_2,\cdots,X_n$ 是来自正态总体 $X\sim N(\mu,\sigma^2)$ 的样本，样本均值为 $\bar{X}$ ，样本方差为 $S^2$ ，则有：

(1)
$\bar{X}\sim \mathcal{N}(\mu,\frac{\sigma^2}{n})$
$\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim \mathcal{N}(0,1)$

(2) $\bar{X}$ 与 $S^2$ 相互独立，且
$\frac{(n-1)S^2}{\sigma^2}=\frac{1}{\sigma^2} \bigg[\sum_{i=1}^n(X_i-\bar{X})^2 \bigg] \sim \chi^2(n-1)$

(3)
$T=\frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$

(4)
$\chi^2=\frac{1}{\sigma^2} \bigg[ \sum_{i=1}^n(X_i-\mu)^2 \bigg] \sim \chi^2(n)$
$\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \sim F(n_1-1, n_2-1)$

4.2 两个正态总体

设 $X\sim \mathcal{N}(\mu_1,\sigma_1^2)$ ， $Y\sim \mathcal{N}(\mu_2,\sigma_2^2)$ ， $X_1,X_2,\cdots,X_n$ 和 $Y_1,Y_2,\cdots,Y_n$ 分别来自总体 $X$ 和 $Y$ 的样本，且两个总体相互独立，则有

(1)
$\bar{X}-\bar{Y} \sim \mathcal{N}\bigg (\mu_1-\mu_2,\ \ \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2} \bigg)$
$U=\frac{(\bar{X}-\bar{Y}) - (\mu_1 - \mu_2) } { \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} } } \sim \mathcal{N}(0,1)$

(2) 如果 $\sigma_1^2=\sigma_2^2$ ，则
$T=\frac{ (\bar{X}-\bar{Y}) - (\mu_1 - \mu_2) }{ S\sqrt{\frac{1}{n_1} + \frac{1}{n_2} } } \sim t(n_1+n_2-2)$
其中，
$S^2=\frac{(n_1-1) S_1^2 + (n_2 - 1)S_2^2 }{n_1+n_2 - 2}$