医学数据挖掘流程(一): 需求分析-数据梳理

本文介绍了医学数据挖掘的需求分析步骤,强调了业务指导的重要性。从明确研究目标、数据完整性检查到数据梳理原则,如时间限定、结局限定和统计分析,再到纳排标准的设定。此外,还探讨了数据问题处理和建模方法,包括剂量预测、安全性与经济性分析等。
摘要由CSDN通过智能技术生成

明确需求:先描述想研究啥,用一句话描述,拆成X和Y,然后结合X和Y的数据类型,选择对应的分析方法。

业务指导算法人员要做什么,而不是算法指导业务,比如明确其他检测指标和联合用药,不同的药不一样。因为算法不懂业务啊。

工作流程:业务指导,制定流程。算法根据业务需求搞数据、方法、模型效果。==>形成算法报告。

数据挖掘过程:

  1. 项目研究方案
  2. 拿到院方数据
  3. 与院方讨论数据和需求,明确数据分析目标
  4. 指定数据分析思路。建模没思路,多看论文
  5. 上手

目录

医学数据挖掘基本素养

明确目标 

检查原始数据是否完整

数据梳理原则:时间限定+结局限定+数据统计

 纳排标准

 如果数据有问题/缺失,跟业务和医院沟通纳排标准,或补充数据。

建模


医学数据挖掘基本素养

每一步都要校对数据!!!!!!!!!!!!!!!!!!!!!!!

明确目标 

  • 建模
    • 有效性分析:
      • 剂量预测:tdm回归预测、分类模型。因为在医学上他们通常认为他克莫司在10-20mg的tdm浓度有效!
      • 高低剂量组--统计分析:基线(用药前后的检验指标,至少2个)、配平基线PSM、显著性分析。实验组和对照组: A+B和A;A和0;A+B+C和A+B。 
    • 安全性分析:不良反应分类:0-1二分类、多分类。
    • 经济性分析:数字疗法。成本--效益分析。
    • 个体化用药:剂量预测,回归模型,或主要剂量的二分类/多分类模型。
  • 生存分析:

        cox回归需要非用药对照组,如果用药数据全部出现不良反应,则不能继续做cox,可以做一个高低剂量组统计。

  • 高低剂量组对比统计分析:

        用药前后的检验指标才能形成基线,基线是为了有效性分析,指标变化才能体现出有效性!

        明确分组标准(均值-中位数-各组数据量)、PSM配平基础基线、出入院不良反应(结局事件)。

        需要分析高低剂量用药对疾病治疗或预防的显著差异(关键指标在用药前、用药3d、用药7天变化)(t检验/方差/卡方/U检验)。

  • 经济性分析
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天狼啸月1990

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值