1. 置换检验
置换检验是一种基于重采样技术的统计检验方法,相较于其他统计检验方法,置换检验有着检验精确、不要求多种不同样本、样本变换重组和应用范围广的特点,其思想是统计量的值如果在置换分布中处于非常极端的位置(拒绝域之中)我们就有理由拒绝假设,如图所示。
2. 操作流程
我们要先知道几个重要的概念:
- 显著性水平 a:估计总体参数落在某一区间内,可能犯错误的概率必须在每一次统计检验之前确定,通常取α=0.05或α=0.01,也即是当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。
- P值 p : 当原假设为真时的样本观察结果或为假以及更极端结果出现的概率,p值越小,说明原假设情况的发生概率越小,我们拒绝原假设的理由更充分。
置换检验实现步骤:
令X、Y为独立样本,
1):作出零假设(原假设),设计统计量T
零假设:H0,T=| X的均值-Y的均值 |
2):通过置换样本构造样本
将X、Y打乱重新组成新的样本X、Y
3):建立零分布
设有K次置换样本,每次样本统计量T*=| X的均值-Y的均值 |
4):计算p值,与显著性水平a比较出结果
比较每次T与T的大小,若T ≥ T记为一次结果,统计最终次数为Q次,计算p值:p = Q / K
若p <= a,则说明假设的概率位于拒绝域中,我们应拒绝零假设,否则我们应接受零假设
3. 实例分析
解题步骤:
实例代码:
test <- function(){
n=1000
a=0.05
X=c(194 ,197 , 160, 38 , 99 ,141 , 23)
Y = c(52 ,104 ,146 , 10 , 51 , 30 , 40 , 27 , 46)
T = abs(mean(case)-mean(control))
p_t = 0
total_sample = c(X , Y)
for (i in 1:n){
rand_sample = sample(total_sample , length(total_sample))
p_X = rand_sample[ 1 : length(X)]
p_Y = rand_sample[(length(X)+1):length(rand_sample)]
t = abs(mean(p_X) - mean(p_Y))
p_t = c(p_t , t )
}
p_t = p_t[-1]
p = (length(which((p_t>=T)))+1)/(n+1)
if (p <= a){
cat("p = ",p,"-------拒绝假设, 治疗有效\n")
}else{
cat("p = ",p,"-------接受假设,治疗无效\n")
}
}
运行结果: