1、经验方法:使用预测变量乘以10得出估计的样本量。(logistics回归分析:自变量的15-20倍;多元线性回归:自变量的5~10倍;Cox回归:自变量的15·20倍)
实际需要考虑:预测参数数量,人群数量,发生率,预测率等。
2、利用pmsampsize包:(计算最小样本量)
#pmsampsize实现计算最小样本量
install.packages("pmsampsize")
library(pmsampsize)
#1、二分类变量结局资料
pmsampsize(type="b",#b代表计算二分类变量结果
rsquared=0.201,#指定新模型的(Cox-Snell)R平方期望值:1)同领域先前研究结果2)调整后的R平方值3)可以使用其他值,C统计量cstatistics()或Nagelkerke的R平方
parameters = 24,#预测变量数
prevalence=0.189)#预期总体结局比例
#可以用C指数替代(Cox-Snell)R平方
pmsampsize(type="b",#b代表计算二分类变量结果
cstatistic=0.89,#指定新模型的R平方期望值:1)同领域先前研究结果2)调整后的R平方值3)可以使用其他值,C统计量cstatistics()或Nagelkerke的R平方
parameters = 24,#变量数
prevalence=0.189)#预期总体结局比例
#2、连续变量结局资料
pmsampsize(type = "c",
rsquared = 0.7, #指定新模型的(Cox-Snell)R平方期望值
parameters = 30, #预测变量数
intercept = 67, #平均值
sd = 7)#标准差
#3、生存分析
pmsampsize(type = "s",
rsquared = 0.051,
parameters = 30, #预测变量数
rate = 0.065,#之前研究中总体事件发生率
timepoint = 2, #2年
meanfup = 2.07)#之前研究中平均随访时间
以最后生存分析的结果为例,最小样本量为5143。