明确需求:先描述想研究啥,用一句话描述,拆成X和Y,然后结合X和Y的数据类型,选择对应的分析方法。
业务指导算法人员要做什么,而不是算法指导业务,比如明确其他检测指标和联合用药,不同的药不一样。因为算法不懂业务啊。
工作流程:业务指导,制定流程。算法根据业务需求搞数据、方法、模型效果。==>形成算法报告。
数据挖掘过程:
- 项目研究方案
- 拿到院方数据
- 与院方讨论数据和需求,明确数据分析目标
- 指定数据分析思路。建模没思路,多看论文
- 上手
目录
如果数据有问题/缺失,跟业务和医院沟通纳排标准,或补充数据。
医学数据挖掘基本素养
每一步都要校对数据!!!!!!!!!!!!!!!!!!!!!!!
明确目标
- 建模
- 有效性分析:
- 剂量预测:tdm回归预测、分类模型。因为在医学上他们通常认为他克莫司在10-20mg的tdm浓度有效!
- 高低剂量组--统计分析:基线(用药前后的检验指标,至少2个)、配平基线PSM、显著性分析。实验组和对照组: A+B和A;A和0;A+B+C和A+B。
- 安全性分析:不良反应分类:0-1二分类、多分类。
- 经济性分析:数字疗法。成本--效益分析。
- 个体化用药:剂量预测,回归模型,或主要剂量的二分类/多分类模型。
- 有效性分析:
- 生存分析:
cox回归需要非用药对照组,如果用药数据全部出现不良反应,则不能继续做cox,可以做一个高低剂量组统计。
- 高低剂量组对比统计分析:
用药前后的检验指标才能形成基线,基线是为了有效性分析,指标变化才能体现出有效性!
明确分组标准(均值-中位数-各组数据量)、PSM配平基础基线、出入院不良反应(结局事件)。
需要分析高低剂量用药对疾病治疗或预防的显著差异(关键指标在用药前、用药3d、用药7天变化)(t检验/方差/卡方/U检验)。
- 经济性分析