统计学基本知识 # datawhale 任务三

最新推荐文章于 2024-08-27 17:18:41 发布

weixin_44593278

最新推荐文章于 2024-08-27 17:18:41 发布

阅读量165

点赞数

分类专栏： datawhale

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44593278/article/details/88090981

版权

datawhale 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

假设检验

基本原理

假设检验是数理统计中根据一定假设条件由样本推断总体的一种方法，依据的原理是小概率事件原理，即小概率事件在一次试验中是几乎不可能发生的。

基本概念与基本步骤

基本步骤

建立假设——原假设与备择假设
原假设记作 $H_0$ ,是指待检验的假设，一般为研究者想要收集证据反对的，没有充分理由否定的假设。
备择假设记作 $H_1$ ,是指与原假设相对的假设，一般为研究者想要收集证据支持的，没有充分理由肯定的假设。
一般来说是相互对立的，但有时可能存在既拒绝原假设又无法接受的备择假设的情况。
确定适当的检验统计量（t,p,z）并计算。
（1）在样本容量<30，且总体方差 $\sigma$ 未知时，采用t-统计量进行假设检验。即指定抽样分布服从t分布，并查阅分布表进行对比。
（2）在样本容量>30，且总体方差已知（若样本容量<30也可以）时，采用z-统计量进行假设检验。即抽样分布服从正态分布，并查阅z-值表进行对比。
（3）样本容量>30，也可以通过计算p值，并与显著性水平 $\alpha$ 进行对比进行检验。p值指小概率事件发生概率，显著性水平则指拒绝原假设的概率（ $\alpha$ 通常很小，由人为决定）
给定显著性水平，确定拒绝域，并进行判断
检验统计量若落入抽样分布的拒绝域，则可以拒绝原假设，接受备择假设。
检验规则有两种：
（1）临界值规则。将检验统计量的值（t，z）与显著性水平的临界值进行对比，得出是否拒绝原假设。
（2）P—值规则。指将检验统计量对应的概率p与显著性水平进行对比，得出是否拒绝原假设。
一般也可以由结果得出置信区间。

两类错误

第一类错误

指原假设事实上为真，但却拒绝原假设的错误，也叫弃真错误， $\sigma$ 错误。

第二类错误

指原假设事实上为假，但却接受原假设的错误，也叫取伪错误， $\beta$ 错误。
人们总希望 $\sigma$ , $\beta$ 越小越好，但当样本容量一定时，一类错误几率减小，另一类错误几率便增大。若要使两类错误概率都减小，只能增加样本容量。

两个样本均值之差的方差

$\mu_{x+y} = \mu_x + \mu_y$ ， $\mu_{x-y} = \mu_x - \mu_y$

$\sigma_{x+y}^2 = \sigma_x^2 + \sigma_y^2$ ,

$\sigma_{x-y}^2 = \sigma_x^2 + \sigma_y^2$ .
注意区别，具体推导日后再补。

weixin_44593278

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。