假设检验-统计学自学笔记

假设检验的一般问题

例子(女士品茶)

20世纪20年代后期,在英国剑桥一个夏日的午后,一群大学的绅士和他们的夫人们,还有来访者,正围坐在户外的桌旁,享用着下午茶。在品茶过程中,一位女士坚称:把茶加进奶里,或者把奶加进茶里,不同的做法,会使茶的味道品起来不同。

检验方法:取八只外形完全相同的杯子,四只按MT顺序加入奶和茶,另外四只
按TM顺序加入茶和奶,然后随机地放在该女士面前,请她辨别。

若她没有特殊本领,那么她能够做出正确选择的概率非常小:

 若她一次就能选中,那么我们认为她有特殊本领。

1.假设检验的概念与思想

(1)概念

 统计假设(Statistical Hypothesis):事先对总体参数或分布形式作出某种假设
 假设检验(Hypothesis Test):利用样本信息来判断统计假设是否成立的全过程

(假设检验是用于对统计假设证明是否成立的检验。)
假设检验中将要检验的假设称为原假设,用H0表示;
与原假设相对立的假设称为备择假设,用H1表示。
注:(1)“=”只能放在原假设中;
(2)研究者想收集证据予以支持的假设作为备择假设。
例如,在女士品茶检验中,H0:该女士不具备特殊本领;H1:该女士具备特殊本领

(2)统计假设类型(两种)

 参数假设检验: 对总体的参数及有关性质进行的假设检验
 非参数假设检验: 对总体分布类型、独立性或相关性等一般性论断进行的假设检验


(3) 理论依据


 小概率原理: 小概率事件在一次试验中几乎不可能发生


(4) 基本思想


 某种带有概率性质的反证法思想:
在H0成立条件下,如果在一次试验中出现了小概率事件,就拒绝H0

 

2.假设检验的步骤

(1) 怎样提出原假设和备择假设?

 双边假设检验
等式为原假设,不等式为备择假设。
【例】某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于
不合格,检验某企业生产的这种零件合格吗?
原假设H0: m = 10
备择假设H1: m =\ 10

 研究中的假设检验

把希望(想要)证明的假设作为备择假设,或者说,将认为研究结果是无效的说法或理论作为原假设。研究成果是有效的设置成为备择假设。

【例】原有汽油平均效率不超过了25英里/加仑,某研究小组开发了一种新
型汽油,检验其平均效率是否超过了25英里/加仑。

原假设H0: m<=25

备择假设H1: m > 25

等式一直在原假设那边。而且这里明显就是要证明原假设代表的理论无效

 检验某项声明的有效性

将所作出的声明作为原假设,对该说明的质疑作为备择假设。
【例】某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上

原假设H0: m >=1000
备择假设H1: m < 1000

 总结:
• 备择假设是想收集证据予以支持或证明的假设;
• 原假设是现在大家认同,但是有怀疑的假设,是想收集证据予以推翻的假设。

假设检验的步骤

(1) 提出原假设和备择假设;
(2) 确定适当的检验统计量,根据样本数据计算统计量的值;
(3)规定显著性水平,根据统计量的抽样分布找到显著性水平
对应的临界值;
(4) 根据统计量的值与临界值进行比较,若小概率事件发生
即存在概率意义上的矛盾,则作出拒绝原假设的统计决策。

如何抉择怎么样拒绝原假设(在质疑的时候)

先看例子:

这个例子非常有意思,可以多看一会。

样本的方差等于总体方差除样本个数

转为标准正态分布的时候,均值U=样本均值-期望/(样本标准差) 满足标准正态分布

标准正态分布可以查表!

3.假设检验中的两种错误

 

 两类错误的关系

 当H0、H1给定,n 固定时,无法同时使\alpha 和\beta 变小。

使α、β 同时变小的办法就是增大样本容量。

一般地说,哪一类错误所带来的后果越严重,危害越大,在
假设检验中就应当把哪一类错误作为首要的控制目标。

由于\beta不易计算,所以通常我们主要控制\alpha ,尽量减小\beta 。、

4.双边检验和单边检验

二、正态总体参数的假设检验

一共有这些小点

1、正态总体参数假设检验的步骤
2、单个正态总体参数的假设检验
3、两个正态总体参数的假设检验
4、p 值的应用

 1、正态总体参数假设检验的步骤

(1) 建立原假设H0和备择假设H1;

 常用的假设形式:

 (2) 选择检验用的统计量;

标准正态u,student t 和x方 检验

(这几种还是需要再去仔细思考一下)

t检验中的s是样本方差,x中的也是,

就比如上面咖啡的例子就转化成为标准正态分布 

(3) 确定显著水平α的值,查相应的分布表得其临界值以及拒绝域。
(4) 进行显著性判别。

接下来看点例子:

2.单个总体均值的假设检验例题

 (例1)

样本均值=0.076

x拔-总体均值/(总体标准差/根号样本数量)

 (例2)

第四题,

用到了t检验 (知道样本标准差)


t分布,插个嘴

在概率论和统计学中,t-分布t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。 [1] 

t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线

此时这里的统计量较小,且不知道总体 方差或者标准差


总体方差的x方检验例题

 


 3.两个正态总体参数的均值检验

这三个组间比较的非常的重要啊!!!!

4.p值(皮尔森系数)的应用

p value: 把H0错判为假的概率。p越小说明,错判概率越小,则有足够把握拒绝H0,接受H1

看看例子吧家人们。

例一就是

三.非参数的假设检验 

1、两个总体分布差异的检验
(1)符号检验法
(2)秩和检验法
2、总体分布的假设检验
(1)拟合优度检验法
(2)列联表的独立性检验
(3)正态概率纸

 

  • 19
    点赞
  • 111
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
在进行假设检验分析时,可以使用Python进行操作。但是需要注意的是,使用Python进行假设检验可能效率不够高,建议使用专门的统计软件如SPSS进行分析。 假设检验是对总体参数提出一个假设,并利用样本信息来验证这个假设是否成立。在假设检验中,通常会设置两个假设,一个是原假设(H0),也称为零假设,一般是统计者想要拒绝的假设。另一个是备择假设(H1),是统计者想要接受的假设。 在假设检验中,存在两种错误。一种是弃真错误,也称为第一类错误或α错误,指的是原假设是真实的,但通过样本估计总体参数时却拒绝了原假设。弃真错误的概率通常表示为α,取值越小,犯弃真错误的概率越小。另一种是取伪错误,也称为第二类错误或β错误,指的是原假设实际上是不真实的,但通过样本估计总体参数时却承认了原假设。取伪错误的概率表示为β。 综上所述,可以使用Python进行假设检验分析,但为了提高效率,推荐使用专门的统计软件如SPSS进行分析。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [利用python进行假设检验](https://blog.csdn.net/qq_45626019/article/details/107997683)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

就是随便学学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值