R语言调整随机对照试验中的基线协变量

拓端研究室

已于 2024-07-31 20:40:38 修改

阅读量1.1k

点赞数

文章标签： R语言调整随机对照试验基线协变量

于 2019-09-06 13:35:52 首次发布

本文链接：https://blog.csdn.net/qq_19600291/article/details/100577479

版权

全文链接：http://tecdat.cn/?p=6386

原文出处：拓端数据部落公众号

随机对照试验构成通常被认为是用于评估某些干预或感兴趣治疗效果的金标准设计。参与者被随机分配到两个（有时更多）的群体这一事实确保了，至少在期望中，两个治疗组在测量的，重要的是可能影响结果的未测量因素方面是平衡的。因此，两组之间结果的差异可归因于随机化治疗而不是对照（通常是另一种治疗）的效果。

如果随机化没有受到影响，即使不调整任何基线协变量，试验的治疗效果估计也是无偏的。即使在各组之间的某些基线变量出现不平衡的情况下也是如此。这是因为偏差被定义为估计量（由我们的统计程序给出，如线性回归）是否在重复样本中具有等于目标参数的期望。有时估计值会高于真实值，有时低于真实值，但只要平均值等于目标值，我们就会说估算值是无偏见的。

协变量调整

现在让我们考虑调整一个或多个基线协变量，在我们的分析中随机化时。这通常通过拟合结果的回归模型来完成，随机组和基线变量作为协变量。

我们可以使用R来说明这一点。我们将模拟n = 50个受试者的小型研究的数据，随机化50％治疗= 0和50％治疗= 1。然后，我们将根据基线协变量X和治疗指标生成结果Y：

n < -  50
set.seed（31255）
x < -  rnorm（n）
治疗< -  1 *（runif（n）<0.5）
y < -  x +治疗+ rnorm（n）

在这里，第1组与第0组的真正治疗效果是1.如果我们执行未经调整的分析，我们获得：

> summary(lm(y~treat))

Call:
lm(formula = y ~ treat)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.8977 -0.9312  0.0990  1.3050  2.7046 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -0.5556     0.3268  -1.700 0.095571 .  
treat         1.8113     0.4447   4.073 0.000173 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.567 on 48 degrees of freedom
Multiple R-squared:  0.2568,    Adjusted R-squared:  0.2413 
F-statistic: 16.59 on 1 and 48 DF,  p-value: 0.0001731

估计治疗效果为1.81，标准误差为0.44。现在我们进行分析，我们另外调整基线：

> summary(lm(y~treat+x))

Call:
lm(formula = y ~ treat + x)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4975 -0.6407  0.1508  0.7619  1.6868 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   0.1874     0.2440   0.768  0.44635    
treat         0.9741     0.3234   3.013  0.00416 ** 
x             1.1391     0.1521   7.491 1.48e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.069 on 47 degrees of freedom
Multiple R-squared:  0.6613,    Adjusted R-squared:  0.6468 
F-statistic: 45.87 on 2 and 47 DF,  p-value: 8.955e-1

现在治疗效果估计值为0.97，标准误差为0.32。通过调整X获得的估计值更接近真实值1，并且标准误差更小，表明更精确的估计。通过调整协变量获得的精确度取决于协变量和结果之间的相关性的强度。