2024年亚太中文赛数学建模竞赛B题 洪水灾害的数据分析与预测详细思路解析
解题方法:
首先就是对数据进行数据的预处理包括缺失值和异常值处理,之后就是分析哪些指标与洪水的发生有着密切的关联,可以使用相关性分析(建议使用斯皮尔曼相关系数法,斯皮尔曼相关系数是一种度量两个变量的单调关系(无论是线性还是非线性)的非参数方法。它通过计算变量的秩次来评估相关性,值域也在 -1 和 1 之间。)和灰色关联分析等评价模型。之后通过相关系数判断哪些指标与洪水的发生有着密切的关联,哪些指标与洪水发生的相关性不大。最后需要分析可能的原因并给出合理的建议和措施。
解题方法:首先就是概率聚类,可以使用层次聚类和kmeans聚类等模型,题目给出需要聚类成高、中、低风险三类,之后选取合适的指标,计算不同指标的权重,建立发生洪水不同风险的预警评价模型。这一部分可以使用主成分分析,因子分析,topsis熵权法等模型。最后是灵敏度分析,灵敏度分析方法:全局灵敏度分析:分析每个指标在所有可能值范围内对模型结果的影响。部灵敏度分析:通过逐步改变每个指标的值来观察对结果的影响。可以使用逐个特征扰动的方法,即逐个修改每个特征的值并记录模型输出的变化。
解题方法:洪水发生概率的预测模型,可以使用BP神经网络,回归模型,机器学习模型等模型具体选择通过评价指标判断,合适指标可以采用问题一相关性最高的10个特征。仅用5个关键指标如何改进,问的就行让你改进模型,可以使用优化算法优化我们的预测模型。或者使用交叉验证和网格调优对模型进行一个优化。
解题方法:预测附件test.csv中所有事件发生洪水的概率,通过问题三模型预测test.csv中所有事件发生洪水的概率即可。之后是绘制这74多万件发生洪水的概率的直方图和折线图,这个就是要保证美观,判断是否服从正态分布有很多方法,例如:Q-Q图可以用于判断数据是否服从某个特定的分布(例如正态分布)。如果数据点大致落在一条直线上,则数据大致服从正态分布。绘制数据的直方图,并叠加正态分布曲线,观察数据的分布形状是否与正态分布相符等。