Nhanes美国营养调查数据库的培训课程来了!
“Nhanes数据挖掘”课程即将开始! 欢迎报名, 发表文章即退款
目前在我的在线统计平台上线了“回归控制混杂因素”模块,有兴趣研究研究
https://shiny.medsta.cn/con1/
这个模块的特点
它是一站式的统计模块,一口气完成混杂因素控制
先数据导入、数据整理、哑变量设置、分组差异性分析、回归分析、协变量选择
灵活选择线性、logistic和Cox回归;
批量开展单因素回归;
帮助你挑选出哪些变量P值较小,辅助开展多因素回归;
最后,当然必须可以导出回归分析结果!
具体操作流程,感兴趣可以看看看我的视频
现在我主要来介绍在观察性研究如何控制混杂偏倚
1. 什么是混杂偏倚
现在很多人慢慢地都知道了,混杂偏倚是混杂因素造成的暴露与结局关联性效应的真实值与观察值的偏差。
一般来说,在观察性研究中,分组不均衡造成混杂偏倚的前提条件,而造成分组不均衡的因素很可能是混杂因素,我一般称之为潜在因素。
也就是说,当一个观察性研究评估暴露与结局关系,存在着分组不均衡时,混杂偏倚就很可能存在。
2. 混杂因素的控制方法
通常来说,在统计分析阶段,混杂因素的控制常见有匹配、分层、回归和倾向得分方法。
回归分析是最常见的、但行之有效的方法。线性回归、logistic、Cox回归均可以可以控制混杂偏倚。
3. 回归如何控制混杂因素
回归控制混杂因素,关键就是自变量如何筛选。
一般来说,自变量筛选可以采用以下几条路:
(1)先单因素回归、再多因素回归,P值较小者纳入开展多因素回归
(2)分组先做差异性分析,再多因素回归,,P值较小者纳入开展多因素回归
(3)根据专业知识与文献报道,挑选潜在的混杂因素和重要的协变量纳入多因素回顾模型。
以上这三种方法, 都可以在本人的统计分析平台中实现。一般来说,高质量的论文,还是挺推荐第三种方法的。
在这里强调,混杂因素控制的回归方法,一般不推荐用逐步回归法! 之前有杂志在统计分析指南中就说过这事,有兴趣可以看看这个文章
多因素回归要不要做逐步回归法?美国top杂志《内科学年鉴》给出答案
4. 特别注意
控制因素的时候,千万别纳入中介变量,否则会严重扭曲暴露与结局的关联性。
之前我有一篇文章专门举例一个案例。
漂亮!大咖杰作!中国学者Lancet文章展示如何利用回归方法巧妙探讨影响因素
本周更新到此结束,欢迎各位多提提意见,新的更新,下周一见!
更多实战课程
2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课。如果您有需求,不妨点击查看:
10门科研与统计课程介绍:含孟德尔随机化课程