【临床预测模型】----选择合适的研究数据

【临床预测模型】----选择合适的研究数据

选择数据通常面临许多问题:①②③④⑤⑥⑦⑧⑨⑩

1、现成数据和研究数据
1)现有数据:

①优势:时间、精力、人力成本较低

②劣势
A. 选择偏倚不可控;
B. 数据质量(数据完整性、有效性、可靠性)

③如何获得
A. 既往研究项目的数据
B.医院的电子病例
C.公开的研究数据
公开数据集

【注意】
1)研究设计评估
2)数据申请和使用流程
3)数据质量评估和控制

2)研究数据:

①优势
A. 预测因子
B. 选择偏倚可控(纳排标准)

②劣势:时间、经济、人力成本

③如何获得:开发研究方案,CRF DMP DVP

2、样本量和把握度
1)小样本研究缺陷:

①把握度低,容易过拟合,研究的稳定性、可靠性差
②缺失值对小样本研究的参数估计影响很大
③逐步法筛选预测因子很普遍,但是在小样本研究风险大
④小样本研究,通常缺乏有效的验证,尤其是采用拆分数据做验证集

2)对预测模型样本量的认识:

目前没有广泛且统一的认识;
可供参考的,简易操作准则:
(Event Per Variable EPV>10);样本量是预测因子的十倍以上。
实际考虑

3、训练集和测试集

训练集和测试集的数据划分模式:
1)样本量较大: 随机拆分(2:1)
2)样本量较小: 重抽样、交叉验证
3)多中心:“内部-外部验证”

  • 6
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值