数学建模比赛无论是国赛、亚太赛(小美赛)、美赛都有一个题目是与数据处理有关,例如今年的国赛C题处理有关银行贷款问题、去年美赛分析鉴定产品问题,以及往年亚太赛的C题都是数据处理问题。这类问题相比与其他几个问题难度更低,更方便入门,同时也更有套路可寻,接下来就是我整理的常用的流程与模型。
一.流程:
1.数据预处理
这一步是针对数据中的异常值和缺失值做出清洗和补充,常见的缺失值填充方法有:剔除法、均值法、最小邻居法等等,异常值通常是直接剔除。但是一般大赛提供的数据都是比较正规和完善的不会存在缺失值和异常值,所以这一步基本可以省略。
数学建模论文模板可以了解一下:
数学建模国赛/亚太赛/美赛论文模板/建模论文-淘宝网item.taobao.com2.数据分析
在我们建模之前一定要对数据进行数据分析,依照数据分析的结果来建模,这样才能保证我们模型最终的结果是合理的、完善的;其次一篇正规的建模论文绝对不是上来就讲解模型,而是先要分析数据,从分析中引出我们的模型这样才显得有理有据;最后数据分析这一部分能可视化数据,在论文中放上几张我们可视化的图片能使我们的文章更加美观更加有说服力。
那么常见的数据分析有以下几种:
2.1.统计性描述
统计性描述就是用一些表格和常见的图形(如折线、柱状、饼图)来描绘这批数据的均值、中位数、方差、偏度、峰度以及集中趋势和离散趋势。
2.2.正态检验
假设检验中用的比较多的是正态检验,很多模型在使用时都要求数值服从或近似服从正态分布,所以在建模前需要进行正态性检验。一般地,进行正态检验都是使用spss做P-P图、Q-Q图。spss如何做P-P图、Q-Q图的方法如下,这里就不展开细讲了。
https://jingyan.baidu.com/article/48a42057e667bda9242504f5.htmljingyan.baidu.com2.3.回归分析
2.3.1一元线性回归分析
分析一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量Y或其残差必须服从正态分布。
2.3.2多元线性回归分析
分析多个自变量X与因变量Y的关系,X与Y都必须是连续型变量,因变量Y或其残差必须服从正态分布。使用spss做线性回归分析,链接如下:
https://jingyan.baidu.com/article/b2c186c8055f49c46ef6ff0b.htmljingyan.baidu.com二.常用模型:
1.常用易懂的机器学习方向模型:
分类模型:决策树,朴素贝叶斯分类,支持向量机(SVM),最近领分类(KNN)
聚类模型:K-Means
关联分析:Apriori
连接模型:PageRank
2.评价类常用模型
层次分析法、灰色关联度分析、神经网络综合评价法
3.预测类常用模型
1.朴素估计
2.简单平均
3.滑动平均
4.简单指数平滑
更多的模型可以去看看这篇文章,讲解很详细
来咯兔子:9种时间序列预测模型介绍zhuanlan.zhihu.com