机器学习|参数的假设检验(显著性检验)-- 例题引入、解题方法、基本思想|20mins 入门|概统学习笔记(三十)

引入:在这讨论不同于参数估计的另一类重要的统计推断问题。这就是根据样本的信息检验关于总体的某个假设是否正确。这类问题称作假设检验问题(显著性检验)。

假设检验分为:

  1. 参数假设检验:总体分布已知,检验关于未知参数的某个假设
  2. 非参数假设检验:总体分布未知时的假设检验问题

参数的假设检验

  • 引入:罐装可乐的容量标准应在350毫升和360毫升之间。生产流水线上罐装可乐不断地封装,然后装箱外运。怎么知道这批罐装可乐的容量是否合格呢?

    把每一灌都打开倒入量杯,看容量是否合于标准?(这样做显然不行)

    通常的办法是进行抽样检查

    每隔一定时间,抽查若干罐。如每隔一小时,抽查5罐,得5个容量的值 X 1 , . . . , X 5 X_1,...,X_5 X1,...,X5,根据这些值来判断生产是否正常。

    如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量。

    很显然,不能由5罐容量的数据,在把握不大的情况下就判断生产不正常,因为停产的损失是很大的。

    当然也不能总认为正常,有了问题不能及时发现,这也要造成损失。

    如何处理这两者的关系,假设检验面对的就是这种矛盾。

    ——————————————————思路过程—————————————————

    在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动。这些因素中没有哪一个占有特殊重要的地位。因此,根据中心极限定理,假定每罐容量服从正态分布是合理的。

    这样,我们可以认为 X 1 , . . . , X 5 X_1,...,X_5 X1,...,X5是取自正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本,当生存比较稳定时; σ 2 \sigma^2 σ2是一个常数。现在要检验的假设是:
    H 0 : μ = μ 0 ( μ 0 = 355 ) H_0:\mu=\mu_0(\mu_0=355) H0:μ=μ0(μ0=355)
    (在实际工作中,往往把不轻易否定的命题作为原假设)

    它的对立假设是:
    H 1 : μ ≠ μ 0 H_1:\mu \neq \mu_0 H1:μ=μ0
    H 0 H_0 H0为原假设(或零假设,解消假设);

    H 1 H_1 H1为备选假设(或对立假设)。

    问题1:那么如何判断原假设 H 0 H_0 H0是否成立呢?

    由于 μ \mu μ是正态分布的期望值,它的估计量是样本均值 X ‾ \overline X X,因此可以根据 X ‾ \overline X X μ 0 \mu_0 μ0的差距 ∣ X ‾ − μ 0 ∣ |\overline X-\mu_0| Xμ0来判断 H 0 H_0 H0是否成立。

    ∣ X ‾ − μ 0 ∣ |\overline X-\mu_0| Xμ0较小时,可以认为 H 0 H_0 H0是成立的;

    ∣ X ‾ − μ 0 ∣ |\overline X-\mu_0| Xμ0较大时,应认为 H 0 H_0 H0不成立,即生产已不正常。

    问题2:但是,较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?

    问题归结为对差异作定量的分析,以确定其性质。

    差异可能是由抽样的随机性引起的,称为抽样误差随机误差。这种误差反映偶然、非本质的因素所引起的随机波动。

    然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了。必须认为这个差异反映了事物的本质差别,即反映了生产已不正常。这种差异称作系统误差

    问题3:根据所观察到差异,如何判断它究竟是由于偶然性在起作用(抽样误差),还是生产确实不正常(系统误差)呢?如何给出一个量的界限呢?

    这里用到在实践中普遍采用的一个原则:小概率事件在一次试验中基本上不会发生

    例如:有两个盒子,A盒里装有999个红球和1个白球,B盒里装有999个白球和1个红球

    ​ 现从两盒中随机取出一个盒子,问这个盒子是A盒还是B盒呢?

    ​ 不妨先假设:这个盒子是B盒。

    ​ 现在从这个盒子中随机摸出一个球,发现是红球。

    ​ 此时该如何判断这个假设是否成立呢?

    ​ 如果假设该盒是B盒,摸出红球的概率只有 1 1000 \frac{1}{1000} 10001,这是小概率事件。

    ​ 小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设是否正确。

    这个例子中所使用的推理方法,可以称为带概率性质的反证法,简称概率反证法

    它不同于一般的反证法,一般的反证法要求在原假设成立的条件下导出的结论时绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设。

    概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设

    在假设试验中,我们称这个小概率为显著性水平,用 α \alpha α表示。

    α \alpha α的选择要根据实际情况而定。常取 α = 0.1 , α = 0.01 , α = 0.05 \alpha=0.1,\alpha=0.01,\alpha=0.05 α=0.1,α=0.01,α=0.05

    现在再次回到前面罐装可乐的例子中:罐装可乐的容量按标准应在350毫升和360毫升之间。一批可乐出厂前应进行抽样检查,现抽查了n罐,测得容量为 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn,问这一批可乐的容量是否合格?

    问题4:在提出原假设 H 0 H_0 H0后,如何作出接受和拒绝 H 0 H_0 H0的结论呢?

    原假设为 H 0 : μ = 355 H_0:\mu=355 H0:μ=355

    对立假设为 H 1 : μ ≠ 355 H_1:\mu \neq 355 H1:μ=355

    由于 σ 1 \sigma_1 σ1已知,选检验统计量 U = X ‾ − μ 0 σ / n ∼ N ( 0 , 1 ) U=\frac{\overline X-\mu_0}{\sigma/\sqrt n}\sim N(0,1) U=σ/n Xμ0N(0,1)

    它能衡量差异 ∣ X ‾ − μ 0 ∣ |\overline X-\mu_0| Xμ0大小且分布已知。

    对给定的显著性水平 α \alpha α,可以在 N ( 0 , 1 ) N(0,1) N(0,1)表中查到分位点的值 u a / 2 u_{a/2} ua/2,使得
    P { ∣ U ∣ > u a / 2 } = α P\{|U|>u_{a/2}\}=\alpha P{U>ua/2}=α
    也就是说, ∣ U ∣ > u α / 2 |U|>u_{\alpha/2} U>uα/2是一个小概率事件。

    故我们可以取的拒绝域为:
    W : ∣ U ∣ > u α / 2 W:|U|>u_{\alpha/2} W:U>uα/2

    在这里插入图片描述
    如果由样本值算得该统计量的实测值落入区域W,则拒绝 H 0 H_0 H0;否则,不能拒绝 H 0 H_0 H0.

  • 基本思想:如果 H 0 H_0 H0是对的,那么衡量差异大小的某个统计量落入区域W(拒绝域)是个小概率事件。如果该统计量的实测值落入W,也就是说, H 0 H_0 H0成立下的小概率事件发生了,那么就认为 H 0 H_0 H0不可信而否定它。否则我们就不能否定 H 0 H_0 H0,而只好接受它。

    不否定 H 0 H_0 H0并不是肯定 H 0 H_0 H0一定对,而只是说差异还不够显著,还没有达到足以否定 H 0 H_0 H0的程度。所以假设检验又叫”显著性检验“。

    如果显著性水平 α \alpha α取得很小,则拒绝域也会比较小。

    其产生的后果是: H 0 H_0 H0难于被拒绝。

    如果在 α \alpha α很小的情况下 H 0 H_0 H0仍被拒绝了,则说明实际情况很可能与之有显著差异。

    基于这个理由,人们常把 α = 0.05 \alpha=0.05 α=0.05时拒绝 H 0 H_0 H0称为是显著的,而把在 α = 0.01 \alpha=0.01 α=0.01时拒绝 H 0 H_0 H0称为是高度显著的。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值