【2025“华中杯”大学生数学建模挑战赛】D题详细解题思路（附代码）

Better Rose

已于 2025-04-17 21:35:14 修改

阅读量1k

点赞数 24

分类专栏：数学建模文章标签：数学建模华中杯 D题

于 2025-04-17 20:36:59 首次发布

本文链接：https://blog.csdn.net/Magnolia_He/article/details/147313241

版权

数学建模专栏收录该内容

118 篇文章

订阅专栏

2025“华中杯”大学生数学建模挑战赛

D题患者院内转运不良事件的分析与预测

数模国赛国一，美赛F奖，统计建模国一，华中杯国一，后续更新2025年“华中杯”数学建模D题的成品论文，高质量保证原创：见文章最后。

在这里插入图片描述

解题思路

一、问题一

1.1 问题分析

患者转运过程中病情变化涉及生理指标动态变化与医疗干预的交互作用。基于附件1（神经外科患者）和附件2（急诊危重患者）的63维变量数据，需从转运前准备（生命体征、设备配置）、转运中监护（生命支持强度、用药情况）、转运后评价（不良事件类型）三个维度构建多模态分析框架。关键挑战在于高维数据的特征选择和混杂因素控制，需采用可解释性强的机器学习模型实现因果推断。

1.2 数学模型

多因素Logistic回归模型可表述如下：
设病情变化事件Y为二分类变量，建立加权回归方程：

$\ln\left(\frac{P(Y=1)}{1-P(Y=1)}\right) = \beta_0 + \sum_{i=1}^{n} \beta_i X_i + \epsilon$

其中 Xi为标准化后的独立变量， $beta_i$ 反映各因素影响强度。

随机森林特征重要性可表述如下：

通过基尼不纯度下降量计算特征贡献度：

$\text{Importance}_i = \frac{1}{N} \sum_{T} \sum_{t \in T} \nu(s_{t,i}) \cdot \Delta \text{impurity}(s_{t,i})$

式中 ( T ) 为决策树集合， $nu(s_{t,i})$ 为节点分割时的样本占比。

1.3 Python代码

from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Logistic回归
lr = LogisticRegression(penalty='l1', solver='saga', max_iter=1000)
lr.fit(X_scaled, Y)
coef_weights = np.abs(lr.coef_[0])

# 随机森林
rf = RandomForestClassifier(n_estimators=100)
rf.fit(X_scaled, Y)
importances = rf.feature_importances_

# 加权融合
combined = 0.6*coef_weights + 0.4*importances
ranking = np.argsort(-combined)

1.4 Matlab代码

% 数据预处理
data = readtable('附件1_2合并.csv');
X = normalize(data(:,1:62));
Y = data.病情变化;

% Logistic回归
mdl = fitglm(X,Y,'Distribution','binomial');
coef_weights = abs(mdl.Coefficients{2:end,1});

% 随机森林
Mdl = TreeBagger(100,X,Y,'OOBPredictorImportance','on');
imp = Mdl.OOBPermutedPredictorDeltaError;

% 综合排序
combined_importance = 0.6*coef_weights + 0.4*imp';
[~,rank_idx] = sort(combined_importance,'descend');

二、问题二

2.1 问题分析

转运后不良事件的发生是多种因素非线性交互作用的结果，需同时考虑显变量（如生命体征）与潜变量（如转运方案合理性）的复合影响机制。基于问题一中筛选出的关键因素（如血氧饱和度、设备报警延迟等），需进一步构建因果网络模型以揭示以下关系：
直接效应：如血管活性药物使用对血压异常的直接影响。
中介效应：如设备报警延迟通过血氧下降间接导致意识改变。
调节效应：如护士经验对导管脱出风险的调节作用。
时间滞后效应：转运时长与药物失效的剂量-效应关系。

2.2 数学模型

多水平结构方程模型（MSEM）：

$\begin{cases} \text{测量模型：} X = \Lambda_\xi \xi + \delta \\ \text{结构模型：} \eta = B\eta + \Gamma\xi + \zeta \end{cases}$

其中，(\xi) 为外生潜变量（如设备状态），(\eta) 为内生潜变量（如不良事件发生概率），(\Lambda_\xi) 为因子载荷矩阵。

贝叶斯网络条件概率，采用马尔可夫链分解：

$\prod_{i=1}^{n} P(X_i|Pa(X_i))$

式中 (MB(Y)) 为节点 (Y) 的马尔可夫毯（父节点、子节点及其父节点）。

2.3 Python代码

from pgmpy.models import BayesianNetwork
from pgmpy.estimators import MaximumLikelihoodEstimator

# 定义网络结构
model = BayesianNetwork([('DeviceAlert', 'OxygenSat'), 
                         ('NurseExp', 'TubeDislodgement'),
                         ('OxygenSat', 'AdverseEvent')])

# 参数学习
data = pd.read_csv('transport_data.csv')
model.fit(data, estimator=MaximumLikelihoodEstimator)

# 条件概率查询
from pgmpy.inference import VariableElimination
infer = VariableElimination(model)
print(infer.query(variables=['AdverseEvent'], 
                 evidence={'DeviceAlert': 1, 'NurseExp': 3}))

2.4 Matlab代码

% 数据准备（示例数据）
data = readtable('transport_data.csv'); 
X = [data.DeviceAlert, data.OxygenSat, data.NurseExp];
Y = data.AdverseEvent;

% 定义模型结构
model = 'AdverseEvent ~ DeviceAlert + OxygenSat + NurseExp';
semModel = sem(model, X, 'CovarianceType','robust');

% 计算路径系数
results = semfit(semModel);
disp(results.PathCoefficients);

% 绘制路径图
semplot(semModel,'Path','on','Latent','off');