t检验

  在研究中最常见的行为就是对两个组进行比较。接受某种新药治疗的患者是否较使用某种现有药物的患者表现出了更大程度的改善?某种制造工艺是否较另外一种工艺制造出的不合格品更少?两种教学方法中哪一种更有效?(可以认为t.test是针对均值的检验;而var.test检测方差)

  1、独立样本的t检验

  一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。这里假设两组数据是独立的,并且是从正态总体中抽得。检验的调用格式为:
  t.test(y ~ x, data)
  其中的y是一个数值型变量, x是一个二分变量。调用格式或为:
  t.test(y1, y2)
  其中的y1y2为数值型向量(即各组的结果变量)。可选参数data的取值为一个包含了这些变量的矩阵或数据框。与其他多数统计软件不同的是,这里的t检验默认假定方差不相等,并使用Welsh的修正自由度。你可以添加一个参数var.equal=TRUE以假定方差相等,并使用合并方差估计。默认的备择假设是双侧的(即均值不相等,但大小的方向不确定)。你可以添加一个参数alternative="less"alternative="greater"来进行有方向的检验。
  在下列代码中,我们使用了一个假设方差不等的双侧检验,比较了南方(group 1)和非南方(group 0)各州的监禁概率:   

library(MASS)
t.test(Prob ~ So, data=UScrime)
	Welch Two Sample t-test

data:  Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1 
     0.03851265      0.06371269 

  你可以拒绝南方各州和非南方各州拥有相同监禁概率的假设(p<0.001

  2、非独立样本的t检验

  非独立样本的t检验假定组间的差异呈正态分布。对于本例,检验的调用格式为:
  t.test(y1, y2, paired=TRUE)
  其中的y1y2为两个非独立组的数值向量。
  

library(MASS)
sapply(UScrime[c("U1","U2")], function(x)(c(mean=mean(x),sd=sd(x))))
           U1       U2
mean 95.46809 33.97872
sd   18.02878  8.44545
with(UScrime, t.test(U1, U2, paired=TRUE))
	Paired t-test

data:  U1 and U2
t = 32.407, df = 46, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 57.67003 65.30870
sample estimates:
mean of the differences 
               61.48936 

  差异的均值(61.5)足够大,可以保证拒绝年长和年轻男性的平均失业率相同的假设。年轻男性的失业率更高。事实上,若总体均值相等,获取一个差异如此大的样本的概率小于0.000 000 000 000 000 22(即2.2e–16)。

  

  注意:本章介绍的检验均是2组之间(而且均是正态分布),若是多余两组可以用方差分析ANOVA

 

  补充:二项分布总体的假设检验

  R软件中关于二项分布检验和估计函数binom.test()。

  binom.test()的使用方法是:

  binom.test(x, n, p, alternative = c("two.sided","less","greater"),conf.lever = 0.95)

  其中x是成功的次数;或是一个由成功数和失败数构成的二维向量。n是实验总数,当x是二维向量时,此值无效。p是原假设的概率。

  例1:有一批蔬菜种子的平均发芽率p0 = 0.85,现在随机抽500粒,用种衣剂进行浸种处理,结果有445粒发芽,试检验种衣剂对种子发芽率有无效果。

  解:根据题意,所检测的问题为:

  H0:p=p0=0.85,H1:p!=p0.   

binom.test(445,500,p=0.85)
	Exact binomial test

data:  445 and 500
number of successes = 445, number of trials = 500, p-value = 0.01207
alternative hypothesis: true probability of success is not equal to 0.85
95 percent confidence interval:
 0.8592342 0.9160509
sample estimates:
probability of success 
                  0.89 

  P值=0.01207<0.05,拒绝原假设,认为种衣剂对种子发芽率有显著效果,从区间估计值来看,种衣剂可以提高种子发芽率。

   例2:据以往经验,新生儿染色体异常率一般为1%,某医院观察了当地400名新生儿,只有1例染色体异常,问该地新生儿染色体异常是否低于一般水平?

  解:根据题意,所检验单的问题为:

  H0:p>=0.01,H1:p<0.01.  

 binom.test(1, 400, p = 0.01, alternative = "less")

	Exact binomial test

data:  1 and 400
number of successes = 1, number of trials = 400, p-value = 0.09048
alternative hypothesis: true probability of success is less than 0.01
95 percent confidence interval:
 0.0000000 0.0118043
sample estimates:
probability of success 
                0.0025 

 

  P值 = 0.09048>0.05,并不能芮乃伟该地区新生染色体异常率低于一般水平。另外,从区间估计值也能说明这一点,区间估计的上届为0.0118>0.01

 

转载于:https://www.cnblogs.com/aloiswei/p/5934256.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值