本周为大家重点介绍一下风暴统计平台的最新板块——多模型三线表!
在观察性研究中,我们经常同时构建多个统计模型,不同的模型放入不同的协变量,从零个的单因素回归分析,到多个协变量的回归模型。看看,结果的稳健性,来控制混杂偏倚。比如这张图:
还有这个
我们平时统计分析,画个三线表挺容易的,但要一下子快速形成多个模型的统计分析结果。还挺费劲的!
但是!目前风暴统计已经实现了这个功能,一站式完成控制混杂因素研究,形成多模型分析的三线表结果!
下面通过一个实操案例来进行操作展示!
一、实操案例介绍
数据集来源于R自带MASS数据集birthwt,这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。本次实操涉及的变量说明如下。
二、风暴统计平台实操
1.进入网站分析模块
电脑端打开风暴统计平台——“风暴智能统计”模块,点击“多模型控制混杂偏倚”,进入操作界面。
2.导入数据集
点击“Browse...”选择需要导入的数据,目前网站支持10M以内的csv、Excel格式数据集。
3.数据的整理转换
关于风暴统计的数据转换,在之前的文章中有详细教程,可以点击下方链接想学习:
4.分类变量参照组设置
如果需要更改对照组,将对照组的编码值方块拖动到第一位即可,最后,记得点击“确定”!
5.分组差异性比较
在操作页面的左侧菜单栏,依次选入分组变量、正态变量、偏态变量、分类变量,右侧秒出各组差异性三线表结果。
6.多模型控制混杂偏倚
①选择回归模型
首先,选择回归模型,包括线性回归、logistic回归、cox生存分析。这里假设我们想要研究孕妇吸烟对胎儿出生体重(low二分类)的影响,选择logistic回归。
这里右侧还贴心的提供了在差异性分析中不同协变量的P值范围,可以看到lwt、smoke、ptl、ui四个变量的P值小于0.05。
②第一个模型
在平台页面“回归变量选择”模块根据提示依次选入核心变量与协变量。例如本研究中想要探讨孕妇吸烟对胎儿出生体重的影响,那么吸烟就是我们研究的核心变量,其他混杂因素作为协变量纳入。
Model1选择不调整任何混杂因素。
③更多模型合并结果
这里我们预设构建3个模型。
model1不调整任何变量
model2调整race、age
model3调整全部的混杂因素。
因此,回归模型数量选择“三模型”,最多可以同时设置4个模型。Model2选入race、age作为协变量。
Model3选入差异性分析中有统计学意义的协变量,以及model2的race、age。
以上设置都完成后,就会自动在右侧生成多模型三线表,比之R语言、SPSS都要快速,省去了自己绘制三线表,抄录数据的繁琐。
多个模型分析结果显示,吸烟smoking对低出身体重low的影响具有统计学意义。
7.导出数据
结果同样支持下载word或excel,十分便捷好用!大家感兴趣的话,就快来试试吧!
这些方法,是不收费的!
https://shiny.medsta.cn/con2/
(复制链接至浏览器打开)