[闲聊统计]之假设检验是什么?(上)

统计学主要分为描述性统计和推断性统计。描述性统计是通过总结和展示数据来描述数据的特征和规律。它主要使用平均值、中位数、标准差等指标来描述数据的分布和趋势。而推断性统计则是通过对样本数据进行分析和推断来对总体进行推断。它主要使用假设检验、置信区间等方法来对总体参数进行估计和推断。

假设检验是统计学中常用的一种方法,用于验证关于总体参数的假设。在实际应用中,假设检验被广泛应用于医学研究、市场调查、质量控制等领域。通过假设检验,我们可以对研究对象进行科学的验证和分析,从而提高决策的准确性和可靠性。

  • 例如:我要研究全国大学生的消费水平,那么我肯定不能把全国的大学生的消费情况都调查一下,这样既费钱又费力。那么我肯定要抽取一部分来做研究,这个抽出来的就叫做样本,全国的大学生的消费水平就叫做总体。并用这个样本结论来代替总体结论。

那么问题来了,我要是抽的这个样本全都是北上广深的学生,那么这个消费水平是不是有点偏高了。若是其他五六线城市的学生,那么这个消费水平是不是会有点偏低。所以假设检验就是在研究我所抽到的这个样本能不能代替总体,能不能以样本结论推断总体,也就是样本量的取值问题。
比如:我总体是100个,我取99个,结论比较准确,但和全取无差异;我取5个,虽然省心,但是样本太少,不足以代表总体。所以原则上是取多少样本量的问题。

1.假设检验问题的提出

1.1假设检验

对总体参数的的数值所作的一种陈述(分析之前必需陈述);总体参数包括总
体均值、比例、方差等;事先对总体参数或分布形式作出某种假设,然后利用样
本信息来判断原假设是否成立;有参数假设检验和非参数假设检验

1.2假设检验背后的哲学

企图肯定什么事物很难,而否定却要相对容易的多。(具有概率性质的反证法)

例如:要证明素数是无限个,那么就利用反证法,可以假设是有限个,再推出矛盾即可证明。这是因为我们企图肯定任何事物很艰难,但是否定一件事相对容易的多。

1.3假设检验遵循的原理

是指在统计学和假设检验中,当一个事件的发生概率非常小时,如等于或小于0.05或0.01,通常认为该事件在一次试验中几乎不可能发生,可视为实际不可能发生的事件。小概率事件虽然发生的概率很小,但也有可能发生.小概率事件的发生也可能造成很严重的后果,比如“9·11 事件”.

举例1:假定某经销商承诺他的这批货中不合格品率在1‰以下,即平均1000件里面只有1件不合格。为检验经销商的说法是否可靠,甲从这批货中随机抽出一件,如果抽出的这件样品,经检查发现是不合格品,则有理由认为经销商承诺是值得怀疑的。

  • 释义:不合格品率在1‰,那么一次抽样就抽到不合格品的概率会很小。但是,甲从这批货中随机抽出一件,就抽到了次品,就说明次品很多,不然不会一次抽样就抽到。

举例2:班主任说我们班95%的学生的期末考试成绩都在90分以上,但是督导老师随机抽区一个学生,这个学生成绩就在90分一下。是否说明班主任的说法有错误?。

  • 释义:95%的学生的期末考试成绩都在90分以上,说明学生成绩在90分以上的人数较多。只抽一个学生,那么抽到90分以上的这个学生的概率就挺高。但是,督导老师从学生中随机抽一个,就抽到了90分以下的学生,就说明90分以下的学生很多,不然不会一次抽样就抽到。

2.假设表达式

2.1原假设(null hypothesis)

  • 待检验的假设,又称“0 假设”;研究者想收集证据予以反对的假设;总是有等号: μ = μ 0 \mu=\mu_0 μ=μ0 μ − μ 0 = 0 \mu-\mu_{0}=0 μμ0=0;表示为 H 0 H_0 H0

2.2备择假设 μ = μ 0 \mu=\mu_0 μ=μ0(alternative hypothesis)

  • 与原假设对立的假设,也称“研究假设”;研究者想收集证据予以支持的假设
    ;总是有不等号: μ ≠ μ 0 \mu\neq\mu_0 μ=μ0 μ − μ 0 ≠ 0 \mu-\mu_{0}\neq0 μμ0=0;表示为 H 1 H_1 H1

举例:由统计资料得知,1989 年某地新生儿的平均体重为 3190 克,现从 1990年的新生儿中随机抽取 100 个,测得其平均体重为 3210 克,问 1990 年新生儿与
1989 年相比,体重有无差异。

H 0 : μ = μ 0 H 1 : μ ≠ μ 0 H_0{:}\mu=\mu_0\quad\quad H_1{:}\mu\neq\mu_0 H0:μ=μ0H1:μ=μ0

这里的 μ = 3210 \mu=3210 μ=3210 μ 0 = 3190 \mu_0 = 3190 μ0=3190

3.假设检验与置信区间的关系

联系:二者都属于推断统计——利用样本的数据得到样本统计量(statistic),然后做出对总体参数(parameter)的论断。

用统计量推断参数时,如果参数未知,则这种推断叫参数估计——用统计量估计未知的参数;如果参数已知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时的统计推断即为假设检验。

4.两类错误

1、第一类错误(弃真错误)
原假设为真时拒绝原假设;第一类错误的概率为α,被称为显著性水平。这个就是我们经常用P值比较的对象。

2、第二类错误(取伪错误)
原假设为假时接受原假设;第二类错误的概率为β。

5.假设检验的流程

  • 提出假设;
  • 确定适当的检验统计量;
  • 规定显著性水平;
  • 计算检验统计量的值;
  • 作出统计决策。
  • 32
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小徐老师_xiho

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值