第五讲 皮尔逊系数之假设检验

假设检验是为了干什么?

现在我有一个假设,我想验证一下这个假设在我的总体数据中是否可以接受,因此要用假设检验来检验一下哈哈哈哈哈哈听起来好像跟没说一样,但这确实是我在刚开始学的时候错过了这个检验是在干什么导致后面举的例子听的一头雾水,原理不明白听讲例子也只是学个步骤而已。

我首先要建立一个假设,成为原假设H0,并将其对立的假设成为备择假设,也就是说,一旦原假设不成立或不被接受,那么备择假设就可以拿出来说成立从而得到检验结果。

采集样本数据以(选取的样本要具有代表性,,比如考虑随机抽样,考虑多样性样本,选取大容量样本,针对问题考虑特殊情境等)后,根据要检验的量选取一个合适的分布,根据实际需求来决定是否对样本进行标准化,然后可以绘制出对样本所选取分布的概率密度图。

选取一个置信水平,这个量代表我们能通过检验的阈值。根据所选取的置信水平和确定的概率密度函数,我们可以计算出统计量,即假设是否通过检验的分界点,如果这个统计量落在了基于置信水平所确定的拒绝域内,则可以判断该假设未能通过检验,拒绝该假设。

以上只是对假设检验的一个极为极为极为粗略的概述,是笔者在学习清风数学建模课程时候的笔记,由于笔者没有任何概率论与数理统计基础,所以内容会相当粗略。

以下是几个在学习过程中的知识补充吧算是:

如何计算你抽出的一个数据检验时用来判断的值?你确定的置信水平实际上就是你要检验的假设发生的概率,当累积密度函数的自变量是你需要求的临界值时,函数值就是概率密度函数在置信水平区间上的积分,因此将累计密度函数求反函数,就可以把临界值反解出来。但这个检验值/临界值会很难求,因此就引出另一个统计量来帮助我们检验--P值。

P值实际上就是根据样本数据计算得到的统计量在零假设成立的情况下出现的概率,就是你想算出来的临界值发生的概率,有了P值以后算概率就可以了就不用再去求反函数了。

以下是由ChatGPT3.5得到的P值的计算方法:

在检验过程中还分为单侧检验和双侧检验,这点不用多说,双侧检验的话就把拒绝域的概率乘2就行了。

  • 9
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值