2023华为杯数学建模E题(思路及代码)

一、血肿扩张风险相关因素探索建模。 

第一题(a):

  1. a题:请根据“表1”(字段:入院首次影像检查流水号,发病到首次影像检查时间间隔),“表2”(字段:各时间点流水号及对应的HM_volume),判断患者sub001至sub100发病后48小时内是否发生血肿扩张事件。

结果填写规范:1是0否,填写位置:“表4”C字段(是否发生血肿扩张)。

如发生血肿扩张事件,请同时记录血肿扩张发生时间。

结果填写规范:如10.33小时,填写位置:“表4”D字段(血肿扩张时间)。

答:

思路:首先,找到最后一次且小于48h的检查时间(随访拍片时间)。找到后的时间ti,减去首次检查时间t1,最后在加上发病到首次影像检查时间间隔|t| ,判断是否在48h内。(注意有可能存在随访1时间点t2-t1>48h的情况,有两例,作废处理为0)。然后利用ti对于的HM_volume数据与首次HM_volume的数据进行判断是否发生血肿扩张变化,1是0否。(判断标准:后续检查比首次检查绝对体积增加≥6 mL或相对体积增加≥33%。)

 第一题(b):  

  1. b题:请以是否发生血肿扩张事件为目标变量,基于“表1” 前100例患者(sub001至sub100)的个人史,疾病史,发病相关(字段E至W)、“表2”中其影像检查结果(字段C至X)及“表3”其影像检查结果(字段C至AG,注:只可包含对应患者首次影像检查记录)等变量,构建模型预测所有患者(sub001至sub160)发生血肿扩张的概率。

答:

思路:第二问是以第一问为基础。首先是对表1 的(字段E至W)、表2(字段C至X)、表3(字段C至AG,注:只可包含对应患者首次影像检查记录)每一列与目标变量进行相关性分析,将相关度高的作为特征提取出来。(第一步的表三有很多的流水号,且顺序被打乱,需要找到对应的编号与表一对应)

        特征提取大概有20-40个特征,接下来就是对前100个病人进行训练。目标变量1列,采用ALO蚁狮算法/随机森林/SVM等方法进行训练。训练准确率到达一定程度后,就可以开始预测血肿扩张的概率。(思路清晰,但是做起来才知道数据提取,与代码预测有耗时)。

二、血肿周围水肿的发生及进展建模,并探索治疗干预和水肿进展的关联关系。

 第二题(a):

  1. 请根据“表2”前100个患者(sub001至sub100)的水肿体积(ED_volume)和重复检查时间点,构建一条全体患者水肿体积随时间进展曲线(x轴:发病至影像检查时间,y轴:水肿体积,y=f(x)),计算前100个患者(sub001至sub100)真实值和所拟合曲线之间存在的残差。

答:

思路:我们观察到每一位患者的检查时间都是不一样的,那么可以考虑将所有的患者的发病时间作为零点,即起始时刻。用后续的随访时间减去首次发病时间,作为时间间隔横坐标,这样就可以将100位病人的时间放置到一起。最后将每一位患者的水肿体积,读取出来,画出100条折线一定是呈现一定规律的)。本问最重要的是曲线拟合,对于多条曲线拟合成,可以采用高斯拟合/核密度估计拟合/混合模型拟合等方法进行曲线拟合。对于残差的处理,每个病人的随访次数不一样,所有考虑利用平均残差的方式(作用是把每个病人的多个残差变成了一个),与拟合曲线进行计算,这样就出现了100组残差。

第二题(b):

2.请探索患者水肿体积随时间进展模式的个体差异,构建不同人群(分亚组:3-5个)的水肿体积随时间进展曲线,并计算前100个患者(sub001至sub100)真实值和曲线间的残差。

答:

思路:第二问在第一问的基础上,进行细分。亚组分类可以使用FCM聚类,获取每个数据点的所属聚类。重复第一问思路即可。或者直接手动细分亚组分为年龄,男女,血压等。将数据提取出来,重复第一问思路即可。

第二题(c):

请分析不同治疗方法(“表1”字段Q至W)对水肿体积进展模式的影响

答:

思路:三种思路提供:1.可计算水肿指标的变化率,评估不同治疗方法对改善效果的影响。得到不同治疗对水肿进展模式的影响大小。2.初始化一个数组来存储每种治疗方法的影响  初始化一个数组来存储每种治疗方法的皮尔逊相关系数 ,计算每种治疗方法对水肿体积进展的平均影响  计算该治疗方法的皮尔逊相关系数 创建箱线图来可视化不同治疗方法的效果。3.使用支持向量机回归模型来计算每种治疗方法对水肿体积进展的影响。

第二题(d):

        请分析血肿体积、水肿体积及治疗方法(“表1”字段Q至W)三者之间的关系

答:

思路:计算血肿指标的变化率,评估不同治疗方法对改善效果的影响 。对血肿体积进展模式影响非常显著,对血肿体积进展模式影响不显著。计算血肿指标与水肿指标的相关性。血肿指标与水肿指标的相关度。数据处理:可提取七种治疗方法作为特征,以及每个病人的血肿、水肿体积数据提取。对于提取的数据存在NaN的情况,可使用高斯拟合的数据进行填充,使得三者的行数相同。

 三、出血性脑卒中患者预后预测及关键因素探索。

 第三题(a):

  1. 请根据前100个患者(sub001至sub100)个人史、疾病史、发病相关(“表1”字段E至W)及首次影像结果(表2,表3中相关字段)构建预测模型,预测患者(sub001至sub160)90天mRS评分。

答:

思路:我们提取100个患者(“表1”字段E至W),首次影像结果(有很多列)。还是对这些列进行归一化,与mRS评分进行相关性分析。要提取较重要的列作为特征。接着就是对前100行数据进行训练,可采用SVM/随机森林/混合投票预测(决策树+SVM)等方法。当训练到一定正确率后,即可预测160个患者的90天mRS评分。

  第三题(b):

  1. 2.根据前100个患者(sub001至sub100)所有已知临床、治疗(表1字段E到W)、表2及表3的影像(首次+随访)结果,预测所有含随访影像检查的患者(sub001至sub100,sub131至sub160)90天mRS评分

答:

思路:与上题思路一致,只需要增加随访的即可。

  第三题(c): 

  1. 3请分析出血性脑卒中患者的预后(90天mRS)和个人史、疾病史、治疗方法及影像特征(包括血肿/水肿体积、血肿/水肿位置、信号强度特征、形状特征)等关联关系,为临床相关决策提出建议

答:

思路:读取100位患者的数据,包括个人史(如年龄、性别等)、疾病史(如高血压、糖尿病等)、治疗方法(如手术治疗、药物治疗等)以及影像特征数据(如血肿/水肿体积、位置、信号强度、形状等)。然后对数据进行清洗和预处理,包括处理缺失数据、异常值和标准化特征。接着创建新的特征或选择最相关的特征来描述患者的情况和影像特征。这可能涉及到特征选择、降维和提取。重点:选择合适的机器学习或深度学习模型来预测患者的预后(例如,使用回归模型或分类模型)。模型应该能够将个人史、疾病史、治疗方法和影像特征映射到90天的mRS分数。最后,将数据拆分为训练集和验证集,并使用训练集来训练模型。然后使用验证集来评估模型的性能。可能需要进行交叉验证以避免过拟合。分析模型的结果,了解哪些特征对预后预测最具影响力。使用解释性工具来解释模型的决策。

        

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值