2024亚太杯中文赛数学建模B题word+PDF+代码

家好,从昨天肝到现在,终于完成了2024年第十四届 APMCM 亚太地区大学生数学建模竞赛B题洪水灾害的数据分析与预测的完整论文啦。

给大家看一下目录吧:

目录

摘 要: 10

一、问题重述 14

二.问题分析 15

2.1问题一 15

2.2问题二 15

2.3问题三 16

2.4问题四 16

三、模型假设 17

四、符号说明 18

五、模型建立与求解 19

5.1问题一模型建立与求解 19

5.1.1 数据预处理 20

5.1.2 相关性分析 20

理论建模 21

相关性分析结果 22

5.1.3结果分析 24

相关性分析结果 25

可能的原因 25

建议和措施 26

5.2问题二模型建立与求解 26

5.2.1 聚类分析 26

理论建模 27

实际聚类 27

5.2.2 指标特征分析 29

理论建模 29

实际分析 29

5.2.3 特征权重计算 30

理论建模 30

实际计算 31

5.2.4 预警评价模型 32

逻辑回归分类模型引入 33

随机森林分类模型引入 33

逻辑回归预测结果 34

随机森林预测结果 35

结果分析 35

5.2.5 灵敏度分析 36

理论建模 36

实际分析 37

5.3问题三模型建立与求解 38

5.3.1 理论建模 38

线性回归 39

支持向量机回归 40

5.3.2 实际求解 42

20个指标 43

10个指标 51

5个指标 54

5.3.3 5指标模型改进 55

5.4问题四模型建立与求解 58

5.4.1 预测应用 58

5.4.2 可视化 60

直方图 60

折线图 60

5.4.3正态分布检验 61

判定方法 61

实际判定 62

六、 模型评价 63

6.1 模型优点 63

6.2 模型缺点 63

七、模型推广 64

八、参考文献 65

附录: 65 问题 1:分析指标与洪水发生的关联性

目标: 分析附件 train.csv 中的数据,识别与洪水发生密切相关的指标,进行可视化,并提出预防建议。

思路:

1. 数据预处理:

o 读取 train.csv 文件,检查缺失值和异常值。

o 对缺失值进行处理,如插值或删除。

2. 特征选择:

o 使用相关性分析(如皮尔逊相关系数)计算各指标与洪水发生概率的相关性。

3. 数据可视化:

o 绘制热力图显示各指标之间的相关性。

4. 结果分析:

o 根据分析结果识别与洪水发生密切相关的指标。

5. 提出建议:

o 根据结果提出合理的洪水预防措施和建议。

这里只是初步思路及代码,后续的完整成品讲解等我会在更新汇总贴更新:

目前第一问求解结果:

添加图片注释,不超过 140 字(可选)

添加图片注释,不超过 140 字(可选)

问题 2. 将附件 train.csv 中洪水发生的概率聚类成不同类别,分析具有高、中、低风险的洪水事件的指标特征。然后,选取合适的指标,计算不同指标的权重,建立发生洪水不同风险的预警评价模型,最后进行模型的灵敏度分析

问题 2:聚类分析与风险评价模型

目标: 将洪水发生概率聚类成不同类别,分析不同风险的洪水事件特征,建立预警评价模型。

思路:

1. 数据预处理:

o 使用标准化方法对数据进行标准化处理。

2. 聚类分析:

o 使用K-means聚类方法对洪水发生概率进行聚类,确定高、中、低风险类别。

o 分析各类别的指标特征,绘制特征雷达图等进行可视化。

3. 特征选择与权重计算:

o 使用主成分分析(PCA)或因子分析选择关键指标。

o 计算不同指标的权重,可以使用层次分析法(AHP)或基于信息增益的方法。

4. 预警评价模型:

o 根据选取的指标和权重,建立洪水风险的预警评价模型。

o 进行模型灵敏度分析,验证模型的稳定性和可靠性。

问题 3. 基于问题 1 中指标分析的结果,请建立洪水发生概率的预测模型,从 20 个指标中选取合适指标,预测洪水发生的概率,并验证你们预测模型的准确性。如果仅用 5 个关键指标,如何调整改进你们的洪水发生概率的预测模型?

问题 3:洪水发生概率的预测模型

目标: 建立洪水发生概率的预测模型,并验证其准确性。

思路:

1. 特征选择:

o 基于问题1中的分析结果,选择与洪水发生关系密切的指标。

2. 模型选择与训练:

o 使用机器学习算法(如逻辑回归、随机森林、XGBoost等)建立预测模型。

3. 模型验证:

o 使用测试集验证模型的预测准确性,计算常见评价指标(如准确率、F1-score等)。

4. 模型改进:

o 如果仅使用5个关键指标,重新进行特征选择和模型训练,比较不同模型的表现。

问题 4. 基于问题 2 中建立的洪水发生概率的预测模型,预测附件 test.csv 中所有事件发生洪水的概率,并将预测结果填入附件 submit.csv 中。然后绘制这 74多万件发生洪水的概率的直方图和折线图,分析此结果的分布是否服从正态分布。

问题 4:预测 test.csv 中洪水发生的概率

目标: 使用问题3中建立的预测模型,预测 test.csv 中所有事件的洪水发生概率,并进行结果分析。

思路:

1. 数据预处理:

o 读取 test.csv 文件,进行相同的预处理步骤(如标准化)。

2. 预测:

o 使用训练好的模型预测 test.csv 中每个事件的洪水发生概率。

3. 结果填充与可视化:

o 将预测结果填入 submit.csv 中。

o 绘制直方图和折线图,分析预测结果的分布情况,检查是否服从正态分布

添加图片注释,不超过 140 字(可选)

  • 24
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嵌入式冰箱

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值