[闲聊统计]之假设检验是什么？(上)

最新推荐文章于 2025-05-03 09:07:35 发布

小徐老师_xiho

最新推荐文章于 2025-05-03 09:07:35 发布

阅读量1.1k

点赞数 32

分类专栏：闲聊统计文章标签：数据挖掘人工智能数据分析

本文链接：https://blog.csdn.net/qq_43286898/article/details/137383627

版权

闲聊统计专栏收录该内容

6 篇文章

订阅专栏

本文介绍了统计学中的描述性统计和推断性统计，重点阐述了假设检验的概念，包括原假设和备择假设的设定，以及如何通过样本数据推断总体参数。文章还讨论了假设检验中的两类错误和显著性水平，以及检验流程的基本步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

统计学主要分为描述性统计和推断性统计。描述性统计是通过总结和展示数据来描述数据的特征和规律。它主要使用平均值、中位数、标准差等指标来描述数据的分布和趋势。而推断性统计则是通过对样本数据进行分析和推断来对总体进行推断。它主要使用假设检验、置信区间等方法来对总体参数进行估计和推断。

假设检验是统计学中常用的一种方法，用于验证关于总体参数的假设。在实际应用中，假设检验被广泛应用于医学研究、市场调查、质量控制等领域。通过假设检验，我们可以对研究对象进行科学的验证和分析，从而提高决策的准确性和可靠性。

例如：我要研究全国大学生的消费水平，那么我肯定不能把全国的大学生的消费情况都调查一下，这样既费钱又费力。那么我肯定要抽取一部分来做研究，这个抽出来的就叫做样本，全国的大学生的消费水平就叫做总体。并用这个样本结论来代替总体结论。

那么问题来了，我要是抽的这个样本全都是北上广深的学生，那么这个消费水平是不是有点偏高了。若是其他五六线城市的学生，那么这个消费水平是不是会有点偏低。所以假设检验就是在研究我所抽到的这个样本能不能代替总体，能不能以样本结论推断总体,也就是样本量的取值问题。
比如：我总体是100个，我取99个，结论比较准确，但和全取无差异；我取5个，虽然省心，但是样本太少，不足以代表总体。所以原则上是取多少样本量的问题。

1.假设检验问题的提出

1.1假设检验

对总体参数的的数值所作的一种陈述(分析之前必需陈述)；总体参数包括总
体均值、比例、方差等；事先对总体参数或分布形式作出某种假设，然后利用样
本信息来判断原假设是否成立；有参数假设检验和非参数假设检验

1.2假设检验背后的哲学

企图肯定什么事物很难，而否定却要相对容易的多。(具有概率性质的反证法)

例如:要证明素数是无限个，那么就利用反证法，可以假设是有限个，再推出矛盾即可证明。这是因为我们企图肯定任何事物很艰难，但是否定一件事相对容易的多。

1.3假设检验遵循的原理

是指在统计学和假设检验中，当一个事件的发生概率非常小时，如等于或小于0.05或0.01，通常认为该事件在一次试验中几乎不可能发生，可视为实际不可能发生的事件。小概率事件虽然发生的概率很小，但也有可能发生．小概率事件的发生也可能造成很严重的后果，比如“9·11 事件”．

举例1：假定某经销商承诺他的这批货中不合格品率在1‰以下，即平均1000件里面只有1件不合格。为检验经销商的说法是否可靠，甲从这批货中随机抽出一件，如果抽出的这件样品，经检查发现是不合格品，则有理由认为经销商承诺是值得怀疑的。

释义：不合格品率在1‰，那么一次抽样就抽到不合格品的概率会很小。但是，甲从这批货中随机抽出一件，就抽到了次品，就说明次品很多，不然不会一次抽样就抽到。

举例2：班主任说我们班95%的学生的期末考试成绩都在90分以上，但是督导老师随机抽区一个学生，这个学生成绩就在90分一下。是否说明班主任的说法有错误？。

释义：95%的学生的期末考试成绩都在90分以上，说明学生成绩在90分以上的人数较多。只抽一个学生，那么抽到90分以上的这个学生的概率就挺高。但是，督导老师从学生中随机抽一个，就抽到了90分以下的学生，就说明90分以下的学生很多，不然不会一次抽样就抽到。

2.假设表达式

2.1原假设(null hypothesis)

待检验的假设，又称“0 假设”；研究者想收集证据予以反对的假设；总是有等号： $\mu=\mu_0$ 或 $\mu-\mu_{0}=0$ ；表示为 $H_0$ 。

2.2备择假设 $\mu=\mu_0$ (alternative hypothesis)

与原假设对立的假设，也称“研究假设”；研究者想收集证据予以支持的假设
；总是有不等号： $\mu\neq\mu_0$ 或 $\mu-\mu_{0}\neq0$ ；表示为 $H_1$ 。

举例：由统计资料得知，1989 年某地新生儿的平均体重为 3190 克，现从 1990年的新生儿中随机抽取 100 个，测得其平均体重为 3210 克，问 1990 年新生儿与
1989 年相比，体重有无差异。
$H_0{:}\mu=\mu_0\quad\quad H_1{:}\mu\neq\mu_0$
这里的 $\mu=3210$ ， $\mu_0 = 3190$