k折交叉验证优缺点_都说K折交叉验证最常见,你会做吗?

本文介绍了在临床研究中如何使用K折交叉验证验证预测模型的可靠性,特别是在logistic回归中的应用。通过R软件进行K折交叉验证,强调了在SPSS中缺乏此功能,而R软件提供了cv.glm函数。文章提供了详细的R代码步骤,包括数据导入、成本函数定义、交叉验证过程,并指出结果的轻微变化是由于随机分组导致的。
摘要由CSDN通过智能技术生成

在临床研究领域,大家特别希望能够未仆先知,于是临床研究者尝试去建立各种预测模型。比如,凭借孕妇的信息预测低出生体重儿的结局。怎么建立预测模型呢?常见的做法是这样的:以低出生体重儿为因变量,以相关的孕妇信息作为自变量,建立logistic回归模型。

有了模型,一般还需要验证模型的可靠性稳定性。小编比较推荐外部验证,也就是说“用现有的数据建立模型,再收集一部分病例进行模型的验证”。其中,K折交叉验证比较常见。K折交叉验证,就是将数据随机、平均分为K份,其中(K-1)份用来建立模型,在剩下的一份数据中进行验证。比如,常见的10折交叉验证,“将数据随机、平均分为10份,其中9份用来建模,另外1份用来验证,这样依次做10次模型和验证,可得到相对稳定的模型。

说的这么热闹,怎么实现呢?SPSS可以吗?SPSS目前只是在某些模块(如决策树、判别分析)设置了交叉验证的选项,而在我们常用的线性回归、logistic回归却是没有的。小编觉得大家可以利用R软件完成交叉验证。

即使大家之前从未接触过R软件,也不难。下载、安装、运行R软件后,将小编接下来要说的程序粘贴到R控制台,改动几个参数即可。

首先,咱们需要有R软件。选择下列任意一个网站,即可链接到R下载页面。选择合适的版本,默认安装即可。

https://mirrors.tuna.tsinghua.edu.cn/CRAN/

http://mirrors.tuna.tsinghua.edu.cn/CRAN/

https://mirrors.ustc.edu.cn/CRAN/

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值