分类模型
1、距离聚类(系统聚类)(常用,需掌握)
优点
①将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类
②是一种探索性的分析方法,分类结果不一定相同
例如:主要用于样本数据的初步处理缺点
(1)用户需要先指定K,但到底指定K为多少是不知道的。
(2)对初值敏感。不同的初始化中心很容易导致不同的聚类结果。(3)对于孤立点数据敏感。
2、关联性聚类(常用,需掌握)
3、层次聚类,密度聚类(DBSCAN)
6、贝叶斯判别(统计判别方法,需掌握)
7、费舍尔判别(训练的样本比较多,需掌握)
8、模糊识别(分好类的数据点比较少)
预测模型
1、灰色预测模型(必须掌握)
满足两个条件可用:
①数据样本点个数少,6-15个
②数据呈现指数或曲线的形式
例如:可以通过极值点和稳定点来预测下一次稳定点和极值点出现的时间点
2、微分方程预测(高大上、备用)
要求:
①无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据的关系。
②微分方程关系较为复杂,微分方程的解比较难以得到,如果数学功底不是很好的一般不会选择使用。
③由于方程的建立是以局部规律的独立性假定为基础,当作为长期预测时,误差较大
3、回归分析预测(必须掌握)
求一个因变量与若干自变量之间的关系,若自变量变化后,求因变量如何变化;
样本点的个数有要求:
①自变量之间的协方差比较小,最好趋近于0,自变量间的相关性小;
②样本点的个数n>3k+1,k为自变量的个数;
③因变量要符合正态分布
4、马尔科夫预测(备用)
要求
1、一个序列之间没有信息的传递,前后没联系,数据与数据之间随机性强,相互不影响;(今天的温度与昨天、后台没有直接联系)2、不仅要能够指出事件发生的各种可能结果,而且还必须给出每一种结果出现的概率(预测后天温度高、中、低的概率,只能得到概率)
3、一般计算状态转移概率,状态为定类(“畅销”、“一般”、“滞销”)
丰收预测,天气预报
资料引用
(71条消息) 数学建模常用模型23:马尔可夫预测方法_Halosec_Wei的博客-CSDN博客_马尔可夫预测法
5、时间序列预测(必须掌握)
与马尔科夫链预测互补,至少有2个点需要信息的传递,AR模型、MA模型ARMA模型,周期模型,季节模型等
6、小波分析预测(高大上)
数据无规律,海量数据,将波进行分离,分离出周期数据、规律性数据;可以做时间序列做不出的数据,应用范围比较广
7、神经网络预测(备用)
大量的数据,不需要模型,只需要输入和输出,黑箱处理,建议作为检验的办法
评价模型
1、模糊综合评判(经常用,需掌握)
评价一个对象优良中差等层次评价,评价一个学校等,不能排序
2、主成分分析(数据降维)(经常用,需掌握)
特点:
①将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法
②主成分保留了原始变量绝大多数信息
③主成分的个数大大少于原始变量的数目
④各个主成分之间互不相关
⑤每个主成分都是原始变量的线性组合
例如:找出某个事件的前几个主要影响因素
评价多个对象的水平并排序,指标间关联性很强
3、层次分析法(AHP)(经常用,需掌握)
特点:
①层次权重决策分析
②较少的定量信息
③多目标、多准则或无结构特性
④适用于难以完全定量的复杂系统
例如:做出某种决策需要考虑多方面的因素
做决策,去哪旅游,通过指标,综合考虑做决策
、
4、多属性决策
特点:
①利用已有的决策信息
②对一组(有限个)备选方案进行排序或择优
③属性权重和属性值为参考值
例如:投资决策、项目评估、维修服务、武器系统性能评定、工厂选址、投标招标、产业部门发展排序和经济效益综合评价等
5、秩和比综合评价法(经常用,需掌握)
评价各个对象并排序,指标间关联性不强
6、优劣解距离法(TOPSIS法)
7、投影寻踪综合评价法
揉合多种算法,比如遗传算法、最优化理论等
8、方差分析、协方差分析等(经常用,需掌握)
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产量有无影响,差异量的多少;(1992年,作物生长的施肥效果问题)
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因素,但注意初始数据的量纲及初始情况。(2006年,艾滋病疗法的评价及预测问题)
优化模型
线性规划
特点:
①用于辅助人们进行科学管理
②求线性目标函数在线性约束条件下的最大值或最小值
③三要素:决策变量、约束条件、目标函数
例如:工厂分配资源生产使得利润最大化
非线性规划
整数规划
动态规划
多目标规划
遗传算法
- 直接对结构对象进行操作,不存在求导和函数连续性的限定;
- 具有内在的隐并行性和更好的全局寻优能力;
- 采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。
- 局部搜索能力强,运行时间较短
缺点
全局搜索能力差,容易受参数的影响
(73条消息) 遗传算法详解及matlab代码实现_ccJun-的博客-CSDN博客_遗传算法matlab代码
模拟退火算法
优点是能很好的处理约束,
能很好的跳出局部最优,最终得到全局最优解,
全局搜索能力强;
缺点
收敛较慢,局部搜索能力较弱,运行时间长,且容易受参数的影响.
关联与因果模型
1、灰色关联分析方法(样本点的个数比较少)
特点:
①少量的、不完全的信息
②用于对未来的预测
③能够处理不确定量,使之量化,并寻求系统的运动规律
例如:在社会、经济、科学技术等诸多领域进行测、决策、评估、规划控制、系统分析与建模
2、Sperman或Kendall等级相关分析
3、Person相关(样本点的个数比较多)
4、Copula相关(比较难,金融数学,概率数学)
5、典型相关分析
(因变量组Y1234,自变量组X1234,各自变量组相关性比较强,问哪一个因变量与哪一个自变量关系比较紧密?)
6、标准化回归分析
若干自变量,一个因变量,问哪一个自变量与因变量关系比较紧密