二元logistic回归、ROC曲线及cutoff值

这篇博客介绍了如何利用SPSS和R进行二元逻辑回归分析,以患病与否作为因变量,探讨PRS、年龄和性别等因素的影响。博主详细阐述了数据预处理、回归模型建立、结果解读以及ROC曲线的绘制和cutoff值的确定过程,强调了正确率和AUC在评估模型性能中的作用。同时,提到了在数据量小的情况下,如何平滑ROC曲线的方法。
摘要由CSDN通过智能技术生成

最近在做患病与否和PRS、年龄、性别等回归方程,这里把我的做法做一个总结,以下以SPSS为例
R中也一样glm一下
1、数据你们都有的整理好扔到SPSS里,顺便整理下个数据格式,连续型变量要设为标度在这里插入图片描述
2、回归
我用的是患病与否做因变量,所以我选择二元逻辑回归(分析→回归→二元logistics)
在这里插入图片描述

因变量:患病与否
自变量:你想分析的,连续型变量不用处理,二分类变量需要在分类里选择分类变量
在这里插入图片描述
保存选择概率就好了,绘制ROC需要
在这里插入图片描述
选项里能选的都选上,反正能多出点看看数据情况在这里插入图片描述

确定会出相应的回归曲线
结果主要看这两张表
在这里插入图片描述
第一张表主要是以曲线判定预测正确率
第二张表B为方程系数、显著性(sig.)为显著性差异、Exp为or值最后两列为上下限
方程公式为P=1/(1+EXP(x)),上图为例年龄、性别、PRS均显著,所以x=0.118age+0.439sex+0.876*PRS-11.938

3.ROC曲线绘制及cutoff值确定
分析→ROC曲线
验证变量:上一步保留的概率
状态变量:患病与否等因变量
同样的能勾选的都勾选了
验证变量是上一步保留的概率同样的能勾选的都勾选了

查看结果
个案情况
在这里插入图片描述

区域大于0.7就是比较好了,当然太大就要怀疑一下了,比如0.9以上,过于优秀了,p值一样的要小于0.05。
数据量小时线不是那么平滑,可以双击曲线,add interdependent line→spline→apply,然后选中原线条按delete
ROC平滑曲线
这里就是cutoff值了,第一列和第二列差值最大值对应的变量为cutoff值

在这里插入图片描述
cutoff的具体判定方法如下图在这里插入图片描述

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值