Boot重抽样获取logistic回归内部验证AUC可信区间

bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。
在这里插入图片描述
在这里插入图片描述
在既往文章中,我们已经介绍了《R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间(2)》,很多粉丝发信问怎么做logistic回归内部验证AUC可信区间,我这些天也查了一下资料,发现主要分为两种方法一种是对数据进行重抽样,然后算出每个数据的AUC然后求出可信区间,这种方法是不能绘制ROC的可信区间图的,另一种是对结果数据进行抽样,可以绘制ROC可信区间图,如上图。我打算这两种方法都介绍一下,给大家多一种选择把,继续使用我们的不孕症数据(公众号回复:不孕症,可以获得数据)

library(pROC)
bc<-read.csv("E:/r/test/buyunzheng.csv",sep=',',header=TRUE)

在这里插入图片描述
数据有8个指标,最后两个是PSM匹配结果,我们不用理他,其余六个为:
Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。
有一些变量是分类变量,我们需要把它转换一下

bc$education<-ifelse(bc$education=="0-5yrs",0,ifelse(bc$education=="6-11yrs",1,2))
bc$spontaneous<-as.factor(bc$spontaneous)
bc$case<-as.factor(bc$case)
bc$induced<-as.factor(bc$induced)
bc$education<-as.factor(bc$education)

本文为转载文章,全文地址如下:https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247486291&idx=1&sn=a7c61aa3e886777b8d7f5f05c2bf1809&chksm=ea26eb4fdd5162592a5b56ef2bba6c489564d0207ca415fd829d435121829d5080e9ee9bca20#rd

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在求解逻辑回归模型的AUC(Area Under the Curve)得分时,我们需要先进行模型训练和预测,然后根据预测结果计算AUC。 首先,我们以二分类问题为例,假设我们有一个由N个样本组成的数据集,每个样本都有k个特征。首先,我们需要将数据集分为训练集和测试集。接下来,我们使用训练集进行逻辑回归模型的训练,得到模型的参数。 然后,我们使用已训练的模型对测试集进行预测,得到每个样本属于正类的概率。根据这些概率值,我们可以计算出一组正样本和负样本的排列顺序。 之后,我们使用这组排列顺序,计算ROC曲线(Receiver Operating Characteristic curve)上的各个点。ROC曲线是以假阳性率(False Positive Rate)为横轴,真阳性率(True Positive Rate)为纵轴的二维坐标图。AUC就是ROC曲线下方的面积。 为了计算AUC,我们可以使用数值积分方法,如梯形法则。在梯形法则中,整个曲线被划分为多个小梯形,每个小梯形的面积由两个连续点的纵坐标之和的一半乘以两个点之间的横坐标差值得到。 最后,将所有的小梯形的面积相加,即可得到AUC的值。AUC的取值范围为0到1之间,越接近于1代表模型性能越好,越接近于0则代表性能越差。 总结来说,求解逻辑回归模型的AUC需要进行模型训练和预测,然后利用ROC曲线计算AUC。通过AUC的值,我们可以评估逻辑回归模型的性能和预测能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值