我想,凡是点开这一文章的朋友,都应该知道倾向得分匹配方法了。倾向得分匹配在真实世界临床研究用途越来越广泛,它是一种事后推动组间比较均衡化的方法,控制混杂偏倚。
现在问题是,匹配完了后,应该用什么方法呢?
观察性研究,当我们数据已经均衡可比了,我们应该怎么去分析呢?
可以用普通的统计学方法吗?比如t检验、卡方检验、回归分析分析。
答案是可以的,但又最好不是用传统的两组差异性统计分析分析方法,或者传统的回归。
倾向得分匹配后,出现了两种现象:第一,样本量减少了;第二,匹配带来了数据的聚集性,造成数据不独立。
解决数据不独立性有一下几种方法,这几种也能对抗因样本量减少的问题。
(1)配对设计统计分析:例如配对t,配对卡方,条件logistic回归
(2)分层分析:分层卡方、分层Cox回归等
(3)稳健估计法:广义估计方程、稳健Cox回归
(4)随机效应模型:线性混合效应模型、广义线性混合效应模型、Cox 脆弱模型(Frailty model)
这里对两种常见的场景做一简单的介绍。
(1)二分类结局
二分类结局,倾向得分匹配后,可开展配对卡方检验、也可开展logistic回归分析。
我们都知道logistic回归,但很多不知道,logistic分为条件logistic和非条件logistic分析。
当数据是匹配状态时,建议采用条件logistic回归开展,而倾向得分匹配后,应采用匹配logistic回归,或者说条件logistic分析。
在R语言,条件logistic回归,常用的函数在survival包的clogit函数,以下是示意图。
library(survival)
log2<-clogit(low~drinking+race+strata(subclass1), data=xx)
summary(log2)
郑老师的风暴统计,已经于近日更新条件logistic回归的内容,有需要的各位可以试试
https://shiny.medsta.cn/psm/
(2)生存时间资料
匹配后的生存分析,在Cox回归应用上,我看大多数人还用普通的Cox回归。其实,最推荐的应该是稳健法Cox回归方法,它同样在survival包的conph函数中,增加了cluster参数设置,这个参数设置了,你就知道它的好处了。
coxph(Surv(time, status)~ph.ecog,cluster = subclass,data=cancer1)
除此之外,一些学者推荐了其它的方法,有一种是分层Cox回归,另外就是脆弱模型。
分层Cox回归,Cox方程中增加strata参数设置
coxph(Surv(time, status)~ph.ecog+strata(subclass),data=cancer1)
脆弱模型,Cox方程中增加frailty参数设置
coxph(Surv(time, status)~ph.ecog+frailty(subclass),data=
cox三种回归模型,结果有一定的差异。一些文献,包括我,推荐稳健法Cox回归模型
郑老师的风暴统计,已经于近日更新Cox多种回归的内容,有需要的各位可以试试。
https://shiny.medsta.cn/psmcox/
最后,再次建议:如果你需要数据分析,多多用我本人开发的“风暴统计”在线统计平台,百度“风暴统计”就行。
它不是很完美,但总是对诸位有一些帮助。
本公众提供各种科研服务了!
一、课程培训 2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10门课。如果您有需求,不妨点击查看: 发表文章后退款!2023年郑老师团队多门科研统计直播课程,欢迎报名 二、统计服务 为团队发展,我们将与各位朋友合作共赢,本团队将开展统计分析服务,帮忙进行临床科研。欢迎了解详情: 医学统计服务| 医公共数据库论文一对一指导 |