统计学 假设检验(Hypothesis Testing)

什么是假设检验: 通过设定一个假设, 然后通过收集数据、计算等操作来判断这个假设是否成立。


假设检验的步骤:

1. 设定 null hypothesis 和  alternative hypothesis

2. 收集数据

3. 基于收集的数据,来判断 拒绝 或者 接受 null hypothesis  ( 有两种方法 1. Critical Value  2. P-Value)


值得注意的是:

H0 - null hypothesis

H1 - alternative hypothesis

1. 对于null hypothesis 和 alternative hypothesis 来说,常见的一共有一下几种组合。

H0: μ >= μ0   H1: μ < μ0

H0: μ <= μ0   H1: μ > μ0

H0: μ = μ0     H1:  μ != μ0

注意! a). 对于H1仅仅只有这三种组合。    b). H1 和 H0 永远是相反的 c).一个成功的假设检验的H0和H1的设定是至关重要!

2. significance value: 它是 对null hypothesis 产生误判的概率。 如果value 为5%, 那么我们知道   仅仅只有5%的情况下,null hypothesis 是真的但是我们却拒绝了它。 也就是说,我们有 95%(confidence level)的信心说 null hypothesis 是假的,所以我们拒绝它。当我们使用  收集的数据计算出来的z-score  与5% 相对应的z-score相比较时,如果前者小于后者,那么前者对应的概率会更小,  换句话说,就是可能只有 1%的概率会发生对 null hypo 的误判。这里可能有点绕,但是仔细品味下会很清楚。  另外什么是Critical Value呢?我们已经有了,  significance value 对应的我们可以根据critical value z table 找到相应的 value这个value就是critical value.

这里涉及到了 Type I Error. --  H0 为真,但是被拒绝


3. p-value: 就是 我们犯错的概率,  换句话说, 就是 我们假设 H0 是假, 然后我们拒绝它 的概率. 所以我们期望 我们犯错的概率越小越好, 比较 p-valiue和 alpha的值,  如果p-value 值越大, 我们就该越谨慎,从未不拒绝 H0.




我们通过一个例题来学习。

背景:  一个健身房对外宣称在它这里健身的顾客在两周的锻炼之后会减掉 10 公斤, 根据已收集的数据我们得知, 50 个顾客,平均减掉了 9 公斤,标准差为 2.8 公斤。那么在 significance value 是 5%的情况下,我们能否推论 顾客减掉的体重 会小于 10 公斤?

1. 设定 null 和 alternative

 H0: μ0 >= 10

 H1: μ0 < 10

2. 使用收集的数据的信息,并根据以下的公式计算 test statistic value.  t = -2.53     但是z-score with 5% significance level = -1.645.


 

3.   

3.1)  critical region 方法. 因为t < z-score 所以,对于null hypothesis 发生误判的概率小于 5%。 所以我们拒绝null hypothesis。 得出结论 顾客减掉的平均体重会小于 10 以上的 值得注意的是: 这个板块中有介绍)


3.2) P- value方法. 根据计算出 test statistics = -2.53, 我们能使用z score table 找到相应的p-value值. 通过比较 p-value和significance value( 5%) 

如果 p-value < 0.05, 我们拒绝null hypothesis 




FYI:


### 回答1: 假设检验统计学中一种用于检验随机样本是否来自某一特定分布的方法。它通常用来决定一个假设(称为原假设)是否被拒绝或接受。通常有两种假设:原假设和备择假设。原假设是我们要证明或否定的假设,而备择假设则是原假设的补集。 ### 回答2: 假设检验hypothesis testing)是统计学中最基本、应用最广泛的统计推断方法之一,它用于判断样本信息是否支持某个关于总体的假设,以此为基础作出决策。假设检验的基本思想是,我们提出一个关于总体的某种假设,并利用样本信息对该假设进行验证或证否,进而做出正确的统计推断。 在假设检验中,我们通常会根据问题的特定要求形式化出待检验的假设,它通常被分成两种类型,即零假设(null hypothesis)和备择假设(alternative hypothesis)。零假设是指我们需要验证的假设,通常表示一种相对稳定、均衡、无变化的情况或假设。备择假设则是指我们需要证明零假设错误或不成立的假设,通常表示一种相对不稳定、非均衡、具有变化的情况或假设。对于不同的问题,可选择适当的零假设和备择假设。 在假设检验的过程中,通常需要选择适当的统计量来计样本数据。如均值检验中通常选择t检验或z检验,比例检验中通常选择卡方检验等。然后,利用所选的统计量将原假设的概率映射到检验统计量的分布上,从而得到检验统计量的观测值,并确定其是否落在某一特定的拒绝域内。如果观测值落在拒绝域内,则拒绝原假设,并认为备择假设更为可能成立。反之,如果观测值未落在拒绝域内,则无法拒绝原假设,无法证明备择假设更为正确。 在进行假设检验时,还需确定显著性水平,它代表了接受备择假设需要达到的信心程度。通常,常用的显著性水平是0.05或0.01,即在拒绝零假设之前,需要使错误接受备择假设的概率小于或等于给定的显著性水平。 总之,假设检验作为一种统计推断方法,可以帮助统计学家和决策者正确地理解和分析数据,对研究或决策进行支持和指导。 ### 回答3: 假设检验Hypothesis testing)是一种用来推断与研究问题相关性的统计方法。该方法理论基础是根据样本数据评估一个总体参数的假设,然后使用统计分析来确定这个假设是应该接受还是拒绝。 假设检验有两种假设,即零假设和备择假设。零假设通常是一个默认假设,即当我们没有证据来支持备择假设时,零假设成立。例如,当我们研究一种药物是否真的能够治疗某种疾病时,零假设是这种药物无效;备择假设是这种药物有效。 假设检验的步骤包括: 1. 确定零假设与备择假设; 2. 确定显著性水平(α),即出现假阳性或假阴性的风险; 3. 获取样本数据并计统计量; 4. 计p值,即在零假设成立的情况下,得到观察值或更“极端”观察值的概率; 5. 判断能否拒绝零假设,即p值小于显著性水平(拒绝域),则拒绝零假设。 假设检验的优点是可以用来确定假设是否成立,帮助研究者做出决策。但是,假设检验也有一些局限性,例如: 1. 假设检验并不提供有关总体参数的确切值或置信区间; 2. 如果样本容量小,假设检验的结果可能不准确; 3. 正确的假设检验需要正确地选择假设和显著性水平。如果这些选择不正确,结果可能会偏差。 总之,假设检验是一种简单的推理方法,用于研究问题或比较不同种类的数据。研究者可以通过该方法确定已知参数值的有效性,以及推导结果是随机还是巧合。但是,正确应用假设检验需要仔细考虑所选择的假设和显著性水平,以及样本数据的大小。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值