统计学中的假设检验

样本推测总体

1.0 抽样和区间估计

1.1 点估计

有样本均值估计总体均值
有样本方差估计总体方差

1.2 均值抽样分布

从总体中抽取容量为n的简单随机样本,当样本容量很大时,它的均值抽样的抽样分布近似服从正态概率分布。

对于大多数据应用,假定样本容量达到30(重复抽样的次数)时,就可看作正态分布了。当总体是严重偏态或较多异常点时,样本容量需要达到50。

1.3 置信区间(总体均值的区间估计)

  • 知道总体标准差(z)
    在这里插入图片描述
  • 不知道总体标准差(t)
    在这里插入图片描述

2.0 假设检验步骤

假设检验是用来判定样本于样本,样本于总题之间的差异是由抽样引起的,还是本质引起的

2.1 步骤

  • 假设检验的逻辑是:
    在中心极限定理下的,样本均值服从正态分布(可以求解样本均值的概率),认为小概率事件不会发生——从而决定是拒绝原假设还是接收原假设

  • 假设检验的基本步骤:
    1、确定要进行检验的假设
    2、选择检验统计量 (z?t?)
    3、规定显著性水平,并计算拒绝域
    4、计算检验统计量的值
    5、查看样本结果是否位于拒绝域内
    6、做出决策

2.2 步骤中统计量的选择

  • z检验
  • t检验

2.3 判断方法

显著水平a就是对应的表中的百分比(1%,5%,10%)
p值就是查表对应的具体数值

显著水平和P值均值都是一个临界值,用来判断结果是否属于拒绝域——目的是否拒绝原假设

比较拒绝域和p值:
拒绝域是通过值进行比较,而p值是通过概率比较(显著水平)。先比较于决绝域,p值可以看出结果多么显著。

  • 临界值法

    直接用z值(检验统计量)进行比较

  • p值法(怎么算?)

    将z值求解出来,根据表可以查的出来

    定义:在原假设成立的条件下,检验统计量出现当前值或者更为极端的值概率

    举例p值:
    举例:总共100个产品,但在只有5个次品的情况下,我们假定次品率<=5%(显著水平)的假设,但是我计算统计量后(z值),然后对于表格查到它发生的概率为3%,也就是说总体中只有3个次品,所以我们拒绝原假设

    • 定义:在原假设成立的条件下,检验统计量出现当前值或者更为极端的值概率
    • (默认t)计算:正常的话是求检验统计量z/t值,z/t值知道了,就可以查表得出;或者计算在分布图像中,z/t值的某一侧面积(单测?双侧?)

2.4 相关概念

置信区间–>误差范围
置信水平–>在这个区间内包含总体均值的一个可信程度

eg:我们相信,有95%的几率每个人的智商在[95 105]之间

  • 显著水平

    定义:在假设检验中,犯第一类错误的上限

  • 置信度、置信区间

    #置信区间–>误差范围(1-a,也表示置信度)
    置信水平–>在这个区间内包含总体均值的一个可信程度

    eg:我们相信,有95%的几率每个人的智商在[95 105]之间

    • eg:我们相信,有95%的几率每个人的智商在[95 105]之间

2.5 一二类错误

设计准则:在第一类错误的情况下,减少第二类错误发生的概率

1、当三者中有两者已知,即可计算得到第三者
2、对于给定的显著性水平a,增大样本容量将会减少β
3、对于给定的样本容量,减少a将会使β增大,相反增大a将会使β减少。

第一类错误(弃真)(原假设为真时,拒绝原假设)

就是显著水平的5%
(可以说是在总体中抽到劣质样本的概率)

解决:减少显著水平,增大置信水平

举例:
总共100个产品,其中只有5个次品,
h0 <= 5%
理论上一次抽样我们认为是抽不到次品的,但现在我们真实地就抽到了次品,于是,我们拒绝次品率不超过5%的假设,怀疑这100台手机里的次品超过5台。

5%——人为规定的那些小概率事件,所以可能会犯错

第二类错误(纳伪)(原假设为假时,没有拒绝原假设)

指总体中抽到优秀样本的概率

解决:增加样本量

2.6 对总体均值进行假设检验时样本容量的确定

在这里插入图片描述

3.0 假设检验

步骤:
第一步、
(原假设) H0:
(备择假设) H1:
显著水平是

第二步、
在H0为真的条件下计算某个数值
如果其极端情况比显著水平更极端,则我们拒绝原假设

第三步、
查表确定拒绝域,对比确认是否拒绝原假设

3.1 有关总体参数u的假设检验

根据是否已知方差,分为两类检验:U检验和T检验。
如果已知方差,则使用U检验,
如果方差未知则采取T检验。

  • Z检验(总体方差已知)–大样本

    • 检验一个样本平均数(X)与一个已知的总体平均数(μ0)的差异是否显著
    • 检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著
  • T检验(总体方差未知)–小样本

    • 评断一个总体中的小样本平均数与总体平均值之间的差异程度
    • 评断两组样本平均数之间的差异程度

3.2 检验两个或多个变量之间是否关联

卡方检验属于非参数检验,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。根本思想在于比较理论频数和实际频数的吻合程度或者拟合优度问题。

  • 卡方检验

    • 1.0 卡方分布

      卡方分布主要用于检查实际结果与期望结果之间是否存在显著差别。

    • 1.1 定义
      卡方分布 (χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。

      卡方分布主要用于检查实际结果与期望结果之间是否存在显著差别。

    • 1.2 卡方分布的数学定义
      在这里插入图片描述

    • 1.3 卡方分布的图像

    • 在这里插入图片描述
      1) 卡方分布在第一象限内,卡方值都是正值,随着自由度k的增大, 分布趋近于正态分布;卡方分布密度曲线下的面积都是1.
      2) 卡方分布随着自由度k的增大,χ2分布向正无穷方向延伸(因为均值 越来越大),分布曲线也越来越低阔(因为方差 越来越大)。
      3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
      4) 卡方分布的均值为自由度
      5) 卡方分布的方差为2倍的自由度
      6)自由度越大,该函数图像越对称

    • 用途:检查实际结果与期望结果之间何时存在显著差异,【预测与实际的偏差是正常?还是模型错了?】

3.3 有关参数方差σ2的假设检验

F检验是对两个正态分布的方差齐性检验,简单来说,就是检验两个分布的方差是否相等

  • F检验

    • 检验两个正态随机变量的总体方差是否相等的一种假设检验方法。

3.4 方差分析

4.0 总结

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值