番外篇一：显著性检验的正态性要求

# JFZero

已于 2023-06-15 17:27:14 修改

阅读量1.4k

点赞数

分类专栏：统计学习文章标签：机器学习人工智能

于 2023-04-06 20:42:11 首次发布

本文链接：https://blog.csdn.net/weixin_50348308/article/details/129998485

版权

统计学习专栏收录该内容

17 篇文章 1 订阅

订阅专栏

梳理思路：检验统计量公式→样本与样本均值的正态性→揭示显著性检验的正态原理→标态与普态的关系→正态性要求

1. 检验统计量公式

单样本检验的检验统计量公式原理
单样本检验，是检验样本是否来自总体，因此是以样本均值与总体均值的差异（即x-μ），对照总体正态，计算检验统计量。

为什么分母部分是 $\sqrt{\frac{σ²}{n}}$ 呢！

很纠结，要不要讲呢，讲起来可能真又臭又长，但是不讲，感觉失去了灵魂。
失去灵魂，我所有的笔记，就变为了描绘躯壳，套壳即可用！
但没有灵魂，可不就没意思了嘛！

2. 样本与样本均值的正态性

通常在假设检验中，我们通常都是抽取多个数据进行分析检验（因为抽取单个数据，随机性太大，分析结果不太可靠）。

而抽取多个数据，实际就是抽样。

所有可能的样本均值，实际等于总体均值：例如抽取n=30的样本，穷尽所有n=30的样本组合，这些样本组合的均值最终等于总体均值。

那这些样本均值的方差，是否等于总体方差呢？？？
——这是我非常困惑的！如果能解决这个困惑，想必我会思路更清晰

最终找到：所有样本均值的方差 = $\frac{总体方差}{n}$ ，证明如下
在这里插入图片描述
到这里！！！！！思路异常清晰了！！！！！啊！！！！

我终于可以大声的说，根据【中心极限定理】是可以在总体不服从正态分布的情况下，进行显著性检验的！！！！
天知道，我是一边写，一边才捋顺我之前的困惑！！！！！

我要推翻我之前对于检验统计量公式的任何讲解

3. 揭示正态性的检验原理

首先，显著性检验，是基于样本均值服从正态分布的前提下进行的！
不是基于总体服从正态分布！

检验统计量公式的三座数学基石：
1）所有可能的样本均值，实际等于总体均值【已证得】
2）所有可能的样本均值方差，实际等于 $\frac{总体方差}{n}$ 【已证得】
3）中心极限定理：当样本量n较大时，所有可能的样本均值，服从正态分布。【研究表明，可证，但有空再说】

实际上的显著性检验，就是样本均值vs样本均值总体（即所有可能的样本均值组合）的检验。
样本均值总体：根据【基石3-中心极限定理】，明确服从正态分布；
样本均值总体：根据【基石1】，明确 样本均值的总体均值 为 样本的总体均值 μ
样本均值总体：根据【基石2】，明确 样本均值的总体方差 为 样本的总体方差σ² 的 $\frac{1}{n}$ ，即 $\frac{σ²}{n}$

这里要区分，【样本均值的总体】，与【样本的总体】是不一样的：
-样本均值的总体：由所有可能的样本均值，组合成的总体
-样本的总体：由所有可能的样本数据，组合成的总体

因此，样本均值，服从N(μ， $\frac{σ²}{n}$ ）的样本均值总体的正态分布。

那么，单样本检验：实际就是单个样本均值 vs 样本均值总体的检验。

至此，一切豁然开朗！！！！！！！！！
太开朗了我的天

普通正态分布N(μ， $\frac{σ²}{n}$ ）究竟是怎样计算出概率 P 值，

这里，一定要讲解，标准正态分布与普通正态分布之间的关系！！

重点：标准正态分布与普通正态分布

标准正态分布 N(0,1)，对应的概率密度函数为：
在这里插入图片描述
对标准正态分布的概率密度函数进行积分，求出概率 P 值（积分上下限是标准正态分布下的检验统计量）。

因此，普通的正态分布，其实是可以转化为标准正态分布，再进行积分计算出 P 值的（积分上下限是标准正态分布下的检验统计量）。
普通正态分布的概率密度函数如下：
在这里插入图片描述
因此，检验统计量的存在，主要是将正态分布中的概率密度函数的 x，换为普通正态分布下求得的检验统计量=均值差/标准差

所以，检验统计量，应该是普通正态分布下的 均值差/标准差，即 $\frac{x-μ}{σ}$ ，才能根据标准正态分布，求得概率 P 值。