本周为大家重点介绍一下风暴统计平台的最新板块——倾向性得分匹配(PSM)!
倾向得分匹配法是通过对样本建模(logit模型)得到倾向性得分,通过倾向性得分为试验组组在对照组中找到最接近的样本,从而进行研究的。
目前真实世界研究中的主流控制混杂方法之一就是倾向得分方法,是十分重要的一种统计学方法。
一、实操案例介绍
数据集来源于R自带MASS数据集birthwt,这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。本次实操涉及的变量说明如下。
二、风暴统计平台实操
1.进入网站分析模块
电脑端打开风暴统计平台——“风暴智能统计”模块,点击“一键开展倾向性得分匹配”,两个模块均单独可以开展倾向性得分匹配。
2.导入数据
点击“Browse...”选择需要导入的数据,目前网站支持10M以内的csv、Excel格式数据集。
3. 数据的整理转换
关于风暴统计的数据转换,在之前的文章中有详细教程,可以点击下方链接想学习:
4.分类变量参照组设置
如果需要更改对照组,将对照组的编码值方块拖动到第一位即可,不需要更改参照组的话,只需要选中就可以了,最后,记得点击“确定”!
5.倾向性得分匹配
①匹配前分组差异性比较
在操作页面的左侧菜单栏,依次选入分组变量、正态变量、偏态变量、分类变量,右侧秒出各组差异性三线表结果,并附上SMD值。
②倾向性得分匹配
首先,选择构建倾向性得分的自变量筛选方式。这里给出了四种,如下图所示,方便使用者根据不同的数据类型进行选择。
其次,选择匹配的方法。最常见的便是“nearest”用于最近邻匹配;还有其他3种匹配方式,如“optimal”,最优匹配法用于最佳配对匹配;“full”,完全匹配法用于最佳完全匹配;“genetic”用于遗传匹配;“exact”用于精确匹配。多种匹配方式一站式搞定,超便捷!
最后,选择卡钳值与匹配比例。卡钳值越大,匹配成功的数量越多,但是组间均衡性会变弱。反之,卡钳值越小,组间均衡性会增强,但匹配成功的数量越少。匹配比例通常为1:1或1:2,如果两组的个案数量相差悬殊,也可以选择更大的匹配比例,减少样本量损失。
以上设置都完成后,就会自动在右侧生成匹配后的各组差异性三线表,可以看到,匹配后,两组的各项特征已没有差异性,说明两组人群的组件均衡性佳。
③匹配前后概率密度分析图
这里可以调整“图像模式”,同时显示匹配前后2张图或仅显示匹配前或匹配后的一张图。“图形类型”也有3中可以选择,分别是曲线版、直方图版、折线版。
同时,还可以设置镜像与网格线。
④匹配前后SMD分析图
这里也可以进行网格线与是否折线的个性化设置,直观展现匹配前后SMD的变化情况。
⑤匹配前后统计分析合并表
这里将前面匹配前后各组的差异性三线表进行了合并,在统计报告中通常使用的都是合并后的表格,会更加简洁直观。
⑥下载保存结果
可以将匹配后的数据下载下来再运用其他统计软件做进一步分析,也可以将我们前面的差异性三线表格与图像以excel或word形式下载,直接应用!是不是超便捷?
以上就是风暴统计平台进行倾向性得分匹配的操作全流程了,如果您感兴趣,不妨直接在电脑端浏览打开下方链接试一试,同时您对平台建设有任何建议,可以留言进行交流哦!
⑦ 匹配后的统计分析
匹配后,可以通过回归分析的方法,并快速形成统计分析结果三线表,对于二分类结局,应考虑采用logistic回归,有条件logistic回归和非条件logistic回归;对于生存分析,我没有
郑老师的风暴统计,已经于近日更新条件logistic回归的内容,有需要的各位可以试试
https://shiny.medsta.cn/psm/
Cox多种回归的内容,也已经更新在网站上,有需要的各位可以试试。
https://shiny.medsta.cn/psmcox/
目前,我们可以把单因素和多因素的结果合并到一张表格了,非常方便!
以上就是风暴统计平台进行倾向性得分匹配和分析的的操作全流程了,如果您感兴趣,不妨直接在电脑端浏览打开下方链接试一试,同时您对平台建设有任何建议,可以留言进行交流哦!
本公众提供各种科研服务了!
一、课程培训 2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10门课。如果您有需求,不妨点击查看: 发表文章后退款!2023年郑老师团队多门科研统计直播课程,欢迎报名 二、统计服务 为团队发展,我们将与各位朋友合作共赢,本团队将开展统计分析服务,帮忙进行临床科研。欢迎了解详情: 医学统计服务| 医公共数据库论文一对一指导 |