统计知识基础（一）几种重要分布

最新推荐文章于 2022-06-20 13:26:59 发布

刚发芽的韭菜

最新推荐文章于 2022-06-20 13:26:59 发布

阅读量908

点赞数

分类专栏：统计基础文章标签：正态分布卡方分布 t分布 F分布统计基础

本文链接：https://blog.csdn.net/weixin_44835596/article/details/94591963

版权

统计基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

正态分布

用Y表示表示随机变量，若其服从均值为 $\mu$ ,方差为 $\delta^2$ 的分布规律，则称其为正态分布
$Y\sim N\left(\mu,\delta^2\right)$
经常用在自然和社会科学来代表一组不明的随机变量，正态分布的数学期望为 $\mu$ ，决定了其分布的位置，其方差 $\delta^2$ 或标准差 $\delta$ 决定了分布的幅度。
正态分布的概率密度函数为
$f(x)=\frac{1}{\delta\sqrt{2\pi}}e^-\frac{\left(x-\mu\right)^2}{2\delta^2}$

标准正态分布

标准正态分布是当 $\mu=0$ ， $\delta^2=1$ 时的正态分布，即 $Y\sim N\left(0,1\right)$ 。
在这里插入图片描述

正态分布 $\left(\mu,\delta^2\right)$ 函数曲线下的面积:
68.27%的面积在平均值左右的一个标准差范围内
95.45%的面积在平均值左右两个标准差2σ的范围内
99.73%的面积在平均值左右三个标准差3σ的范围内
99.99%的面积在平均值左右四个标准差4σ的范围内

根据正态分布衍生的三大分布

1. $\chi^2$ 分布

在很久以前，通过看其他资料或者其他形式了解的时候，总是有点半懵的状态，根绝略懂又又些不太懂（可能我比较笨一点），都是因为它们表示得太抽象，难以理解。其实卡方分布可以简单的理解为一句话：n个服从标准正态分布的随机变量的平方和构成一新的随机变量。
设随机变量Y1,Y2,…Yn相互独立, 都服从标准正态分布N(0,1), 则称随机变量 $Y^2=Y^{2}_{1}+Y^{2}_{2}+......+Y^{2}_{n}$ 所服从的分布为自由度为 n 的 $Y^{2}$ 分布。其中n称为自由度（样本中独立或能自由变化的自变量的个数）当总体 $Y\sim N\left(\mu,\delta^2\right)$ ，从中抽取容量为 $n$ 的样本时,则
$\frac{\sum\limits_{i=1}^{n}{\left(X_i-\bar{X}\right)^2}}{\delta^2} \sim \chi^2 \left(n-1\right)$
卡方分布的密度函数为
$\begin{cases} \frac{1}{2^{n/2}\Gamma\left(n/2\right)}e^{-\frac{x}{2}}x^{\frac{n}{2}-1} & \text{x>0}\\\\ 0& \text{x$\leq$0} \end{cases}$

卡方分布有以下特点：
1.分布的变量值始终为正；
2.随着参数 n 的增大，分布趋近于正态分布；
3.期望为， $E(\chi^2)=n$ ，方差为： $D(\chi^2)=2n$ ( $n$ 为自由度);
4.可加性，若存在 $A\sim\chi^2(n_1)$ 和 $B\sim\chi^2(n_2)$ 这样的两个卡方分布，则A+B也服从自由度为 $n_1+n_2$ 的卡方分布。

2. $t$ 分布

假设有两组随机变量：
随机变量 $X$ 服从标准正态分布 $N (0, 1)$
随机变量 $Y$ 服从自由度为 $n$ 的卡方分布 $\chi^2(n)$
$X$ 与 $Y$ 独立，则由服从不同分布的两组随机变量衍生成新的随机变量 $t$ ，且满足一下条件
$t=\frac{X}{\sqrt{Y/N}}$
则称 $t$ 为服从自由度为 $n$ 的 $t$ 分布或学生氏分布。其密度函数为：
$f(x)=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi}\Gamma(n/2)}\left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}$

也是随着自由度逐渐增大，t分布逐渐接近标准正态分布。

3. $F$ 分布

假设有两组随机变量 $U$ 、 $V$ ，且 $U\sim\chi^2(n_1)$ ， $V\sim\chi^2(n_2)$ ， $U$ 、 $V$ 相互独立，当
$F=\frac{U/n_1}{V/n_2}$
则称 $F$ 为服从自由度为 $n_1$ ， $n_2$ 的 $F$ 分布，记为 $F\sim F(n_1,n_2)$
其密度函数为：
$f_{n_1,n_2}(x)= \begin{cases} \frac{\Gamma\left(\frac{n_1+n_2}{2}\right)}{\Gamma\left(\frac{n_1}{2}\right)\Gamma\left(\frac{n_2}{2}\right)}n_1^{\frac{n_1}{2}}n_2\frac{n_2}{2}x^{\frac{n_1}{2}-1}(n_2+n_1x)^{-\frac{n_1+n_2}{2}} & \text{x>0}\\\\ 0& \text{x$\leq$0} \end{cases}$
图示

以上就是统计学中几种比较常见、重要的分布的简单概述，讲到的都是比较浅层的东西，没人深入的透析，而且语言比较通俗。
下一篇总结一下点估计，区间估计和中心极限定理。

刚发芽的韭菜

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
统计知识基础（一）几种重要分布

正态分布用Y表示表示随机变量，若其服从均值为μ\muμ,方差为δ2\delta^2δ2的分布规律，则称其为正态分布Y∼N(μ,δ2)Y\sim N\left(\mu,\delta^2\right)Y∼N(μ,δ2)经常用在自然和社会科学来代表一组不明的随机变量，正态分布的数学期望为μ\muμ，决定了其分布的位置，其方差δ2\delta^2δ2或标准差δ\deltaδ决定了分布的幅度。正...
复制链接

扫一扫