统计基础(五)假设检验中的检验方法

1.R语言的统计分布函数

在R中,有4个与统计分布有关的函数。以X ~ B(n, p)为例。

  • rbinom(size, n, prob)从X随机生成观察值。
  • pbinom(x, n, prob)计算p (x≤x) =?
  • qbinom(p, n, prob)计算p (X≤?)= p
  • dbinom(x, n, prob)计算P(x = x) =?

这些定义可以很容易地传输到其他分布。
唯一的例外是dnorm,它计算概率密度函数在x点的高度。

例子
已知X ∼ B(n = 20, p = 0.4) 和 Y ∼ N (µ = 20, σ^2= 16)是两个独立随机变量
P(X = 10).= dbinom(10, 20, 0.4)P(X ≤ 10).= pbinom(10, 20, 0.4)P(6 ≤ X ≤ 10).= P(X ≤ 10) – P(X ≤ 5) = pbinom(10, 20, 0.4) - pbinom(5, 20, 0.4) P(|X-8| < 2).= P(6 < X < 10) = P(X ≤ 9) – P(X ≤ 6)= pbinom(9, 20, 0.4) - pbinom(6, 20, 0.4)P(Y ≤ 15). = pnorm(15, 20, 4) P(Y < 15). = pnorm(15, 20, 4) P(Y > 15).= 1 – P(Y ≤ 15) = 1 - pnorm(15, 20, 4)P(12 ≤ Y ≤ 15).= P(Y ≤ 15) – P(Y ≤ 12) = pnorm(15, 20, 4) - pnorm(12, 20, 4) P(X ≤ 10, Y < 15).= P(X ≤ 10)P(Y ≤ 15)= pbinom(10, 20, 0.4)*pnorm(15, 20, 4)Z = X-2Y , E(Z) Var(Z).E(Z) = E(X – 2Y) = E(X) – E(2Y) = E(X) – 2E(Y) = 20*0.4 – 2*20Var(Z) = Var(X – 2Y) = Var(X) + (-2)^2Var(Y) = 20*0.4*0.6 + 4(16) = 68.8

  • 若XY相互独立
    Var(aX + bY) = Var(aX) + Var(bY) = a2Var(X) + b2Var(Y)
  • 若XY不独立
    Var(aX + bY) = Var(aX) + Var(bY) = a2Var(X) + b2Var(Y) + 2abCov(X, Y)
    Cov(X, Y) = E(XY) – E(X)E(Y)

2.如何制定决策规则

  • 临界值法
    如果测试统计量落在拒绝区域,则拒绝H0
  • 假定值的方法
    如果p值< α(0.05),则拒绝H0
  • 置信区间方法
    •如果空值(在H0中指定的值)位于置信区间之外,则拒绝H0

2.1假设检验与置信区间的关系

单侧检验 one-side test
当关键词有不得少于/低于的时候用左侧,比如灯泡的使用寿命不得少于/低于700小时时
当关键词有不得多于/高于的时候用右侧,比如次品率不得多于/高于5%时

  • 若p值 > α,不拒绝 H0
  • 若p值 < α, 拒绝 H0

双侧检验 two-side test
双侧检验指按分布两端计算显著性水平概率的检验, 应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。一般假设检验写作H1:μ1≠μ2。

  • 若p值 > α/2, 不拒绝 H0
  • 若p值 < α/2, 拒绝 H0
  • 在这里插入图片描述

2.2假设检验的步骤

H:建立两个假设:H0和H1。
A:陈述检验的假设,并证明它们是否从样本中有效。
T:说明测试统计量,并说明测试统计量在H0状态下的抽样分布。
P:计算P值,P值表示在H0为真的情况下观察该样本(或更极端)的概率。
C:根据p值的大小对结论进行权衡

3.独立总体&相关总体

独立
1.不同的数据集:不相关/独立
2.使用两个样本平均数之间的差X1-X2

相关
1、相同的数据集:成对或匹配/重复措施(前/后)
2、使用每对观察项的差:di=x1i-x2i

3.1两个平均数之间的差值

总体均值,独立样本

  • σ1和σ2未知,假设相等
    使用S1和S2来估计未知的σ1和σ2。使用separate-varience t检验
  • σ1和σ2未知,不假设相等
    用Sp估计未知的σ。使用pooled-variance t检验。

目的:检验假设或对两个总体均值之间的差值形成一个置信区间
差值的估计值是X1 - X2

4.检验方法

在这里插入图片描述

4.1 z检验

n个观察数据来自一个未知的平均数µ和已知的方差σ2的总体
零假设:μ=μ0
Z = X ˉ − μ σ / n Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} Z=σ/n Xˉμ

4.2 t检验

σ未知
总体样本是正态分布的(或n>=30)
Z = X ˉ − μ S / n Z=\frac{\bar{X}-\mu}{S/\sqrt{n}} Z=S/n Xˉμ

4.3 Separate-Variance t检验

假设:

  • 人群正态分布或两个样本大小至少为30。
  • 种群方差是未知的,假定是不相等的。
  • 样本是随机独立抽取的。

总体均值,独立样本
σ1和σ2未知,不假设相等
在这里插入图片描述

e.g.高纤维早餐谷物的膳食效应
尽管存在一些争议,科学家们普遍认为高纤维谷物可以降低患各种癌症的可能性。然而,一位科学家声称,早餐吃高纤维谷类食品的人午餐平均摄入的热量要比早餐不吃高纤维谷类食品的人少。如果这是真的,高纤维谷物制造商将能够宣称食用他们产品的另一个优势——潜在的减肥效果。
作为对这一说法的初步测试,研究人员随机挑选了30人,询问他们早餐和午餐经常吃什么。每个人被确定为食用或不食用高纤维早餐麦片的人,并测量和记录午餐摄入的千焦热量。这些数据列在下面。
在5%的显著性水平上,测试了科学家的说法,即早餐吃高纤维谷物的人比早餐不吃高纤维谷物的人午餐平均摄入的热量更少。

4.4 Pooled-Variance t检验

假设:

  • 人群正态分布或两个样本大小至少为30
  • 种群方差未知,但假设相等
  • 样本是随机独立抽取的

总体均值,独立样本
σ1和σ2未知,假设相等
在这里插入图片描述

例2:台湾儿童多动症
2013年的一项研究使用韦氏智力量表(WISC-III)观察了兴奋剂对台湾患有注意缺陷多动障碍(ADHD)儿童神经认知表现的长期影响。
“在台湾,大约十年前就注意到ADHD的高患病率,但目前仍很少有研究比较ADHD儿童和健康儿童的神经认知功能。”
“由于采样人群的性质、使用的诊断标准、文化差异和方法的局限性,多动症在不同文化中的流行程度各不相同。台湾的患病率估计约为8.4-11.7%;在澳大利亚2.4%;在日本是4%。”

4.5 Paired Difference t检验

两个相关总体的检验方法

  • 成对或匹配的样本
  • 重复措施(之前/之后)
  • 使用配对值之间的差异:di=x1i-x2i

消除被试之间的差异
假设:

  • 差异总体正常或n≥30,且概率d未知
  • 差异是从差异总体中随机选择。

假设第i个配对差异是di,则di=x1i-x2i
搭配不同的点估计总体均值μd是𝑑
样本标准差是sd(n是成对样本中对的个数)
Z = d ˉ − μ d S d / n Z=\frac{\bar{d}-\mu_d}{S_d/\sqrt{n}} Z=Sd/n dˉμd
在这里插入图片描述

4.6 paired t-test 与 two-sample t-test

在这里插入图片描述

4.7 双样本T检验

T检验(或Z检验)可以概括为2个总体和样本。
背景:考虑两个种群,其均值为未知的µX和µy,共同方差为未知的µ^2。我们取两个独立样本。我们想检验一个关于µX-µy的假设。

H: H0:µX-µY=C VS H1:µX-µY<C (注:通常c = 0.)
A 两个种群是正常的,有共同的σ^2。这两个样本是独立的。
在这里插入图片描述

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值