2023华为杯研赛E题完整论文+代码已出

2023年中国研究生数学建模竞赛E题

出血性脑卒中临床智能诊疗建模

1、血肿扩张风险相关因素探索建模

根据题目要求,首先需要判断每个患者是否发生了血肿扩张事件。根据定义,如果后续检查的血肿体积比首次检查增加≥6 mL或≥33%,则判断为发生了血肿扩张。通过分析以上题干内容,我们列写出了具体的判断步骤:

(1)根据问题要求,首先提取表1中入院首次影像检查流水号、发病到首次影像检查时间间隔的数据,以及表2中各时间点流水号及对应的HM _ volume的血肿体积等特征数据;

(2)根据流水号在附表1 中查找对应首次检查的时间点,以及后续影像检查的时间点;

(3)依次计算相邻两次检查血肿体积变化量和变化百分比;

(4)如果变化量≥6mL或变化百分比≥33%,则记为发生血肿扩张,记录下血肿扩张发生的时间点。

(5)对于血肿扩张发生的时间,我们这里通过计算发病至首次影像检查时间间隔与后续随意影像检查时间点与首次影像检查时间间隔的和来得到。

2、采用随机森林算法的预测模型

随机森林(Random forest)[5]是由美国科学家Leo Breiman将Bagging集成学习理论[6]与随机子空间方法[7]结合后提出的一种机器学习算法。

随机森林是以K个决策树{h(Xθk ),k=1,2,...,K}为基本分类器,进行集成学习后得到的一个组合分类器。当输入待分类样本时,随机森林输出的分类结果由每个决策树的分类结果简单投票决定。其中{θk k=1,2,...,K}是一个随机变量序列,它是由随机森林的两大随机化思想决定的:

1) Bagging思想:从原样本集X中有放回地随机抽取K个与原样本集同样大小的训练样本集{Tk k=1,2,...,K},每个训练样本集Tk构造一个对应的决策树。(本题K取1474)

2) 特征子空间思想:在对决策树每个节点进行分裂时,从全部属性中等概率随机抽取一个属性子集,一般选取log2(M) +1个属性,其中M为特征总数,再从这个子集中选择一个最优属性来分裂节点。

训练随机森林的过程就是训练各个决策树的过程,由于各个决策树的训练是相互独立的,因此随机森林的训练可以通过并行处理来实现,这将大大提高生成模型的效率。随机森林中第k个决策树h(Xθk )的训练过程如图所示。

将以同样的方式训练得到K个决策树组合起来,就可以得到一个随机森林。当输入待分类的样本时,随机森林输出的分类结果由每个决策树的输出结果进行简单投票决定。随机森林的分类流程如所示。

随机森林对噪声和异常值有较好的容忍性,能够在不需要降维的情况下处理具有高维特征的输入样本,而且能够评估各个特征在分类问题上的重要性,具有良好的可扩展性和并行性。

随机森林算法可以在分类的基础上进行回归分析,通过将样本分类的结果进行一定的运算可以获得各个特征重要性特征的重要性表示特征对预测结果影响程度,某一特征重要性越大,表明该特征对预测结果的影响越大,重要性越小,表明该特征对预测结果越小。随机森林算法中某一特征的重要性,是该特征在内部所有决策树重要性的平均值,而在决策树中,计算某一个特征的重要性可以采用以下方法:

即某一节点k的重要性为:

式中,ωkωleftωright分别为节点k以及其左右节点中训练样本与总训练样本数目的比例,GkGleftGright分别为节点k以及其左右子节点的不纯度。

得到每一个节点的重要性之后,通过公式得出某一特征的重要性。

为了使所有特征的重要性加起来等于1,需要对每一个特征重要性进行归一化处理, 归一化处理的表达式为:

求解结果

本节我们引入随机森林算法进行分析,采用80%的数据作为训练集,20%的数据作为测试集,进而进行了仿真预测测试,得到了每个决策树的误差值分布情况,如图所示

通过图1我们可以得出随着决策树数量的增加,误差值呈现减小的趋势,且大概决策树数目大于100后,误差稳定在一定的数值范围内波动,符合预期。进一步,我们绘制出了每个特征的重要程度分布情况,如图4所示,其重要性的数值越偏离0,表示该特征对于目标变量的影像越大,重要程度越高。图5给出了训练集适应度曲线图,可以看出其分布情况是符合预期的。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值