算法用途与分类
文章目录
预测问题
灰色预测
线性规划模型
多元回归分析
评价与决策
层次分析法
排队论模型
主成分分析
分类问题
聚类分析
多属性决策模型
优化问题
层次分析法
多属性决策模型(排序,择优)
Dijkstra算法
Floyd算法
模拟退火模型
种群竞争模型
非线性规划与01规划模型
资料
https://blog.csdn.net/qq_27848507/article/details/52160863?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-12.control&dist_request_id=1331979.909.16185794021535343&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-12.control
算法详介
1、层次分析法
层次分析法是将决策问题按总目标、各层子目标、评价准则直至具体的备投方案的顺序分解为不同的层次结构,然后用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最优方案。
案例
假如有3个旅游胜地A、B、C供你选择,你会根据诸如景色、费用和居住、饮食、旅途条件等一些准则去反复比较这3个候选地点.首先,你会确定这些准则在你的心目中各占多大比重,如果你经济宽绰、醉心旅游,自然分别看重景色条件,而平素俭朴或手头拮据的人则会优先考虑费用,中老年旅游者还会对居住、饮食等条件寄以较大关注。其次,你会就每一个准则将3个地点进行对比,譬如A景色最好,B次之;B费用最低,C次之;C居住等条件较好等等。最后,你要将这两个层次的比较判断进行综合,在A、B、C中确定哪个作为最佳地点。
步骤:
建立层次结构模型(自上而下)——构造判断(成对比较)矩阵——层次单排序及其一致性检验——层次总排序及其一致性检验
适用
具有分层交错评价指标的目标系统,而且目标值又难于定量描述的决策问题
判断(成对比较)矩阵
因素i比因素j | 量化值 |
---|---|
同等重要 | 1 |
稍微重要 | 3 |
较强重要 | 5 |
强烈重要 | 7 |
极端重要 | 9 |
两相邻判断的中间值 | 2,4,6,8 |
参考
https://baike.baidu.com/item/%E5%B1%82%E6%AC%A1%E5%88%86%E6%9E%90%E6%B3%95/1672
https://wiki.mbalib.com/wiki/%E5%B1%82%E6%AC%A1%E5%88%86%E6%9E%90%E6%B3%95
【建模真题】https://zhuanlan.zhihu.com/p/43631314
【案例】https://www.docin.com/p-1558023445.html
【与主成分分析区别】https://ask.csdn.net/questions/267139
2、多属性决策模型
利用已有的决策信息通过移动的方式对一组(有限个)备选方案进行排序或者择优。也称有限方案多目标决策,是指在考虑多个属性的情况下,选择最优备选方案或进行方案排序的决策问题
主要由两部分组成:(l) 获取决策信息.决策信息一般包括两个方面的内容:属性权重和属性值(属性值主要有三种形式:实数、区间数和语言).其中,属性权重的确定是多属性决策中的一个重要研究内容;(2)通过一定的方式对决策信息进行集结并对方案进行排序和择优归一化(关键)
- 效益型:属性值越大越好(比如利润);
- 成本型:属性值越小越好(比如成本价);
- 固定型:属性值越接近某个固定值α越好(生产标注宽度);
- 偏离型:属性值越偏离某个固定值β越好;
- 区间型:属性值越接近某个固定区间[q1,q2]越好;
- 偏离区间型:属性值越偏离某个固定区间[q1,q2]越好;
通过一定的方式对决策信息进行集结并对方案进行排序和择优,包括
- 加权算术平均算子(WAA)
- 加权几何平均算子(WGA)
- 有序加权平均算子(OWA)
一般用下**加权算术平均算子(WAA)**将权重和值整合计算即可。
局限性
与之前的层次分析法
一样,它的不足之处在于:
- 不能为决策提供新方案
- 定量数据较少,定性成分多,不易令人信服
- 指标过多时,数据统计量大,且权重难以确定
- 特征值和特征向量的精确求法比较复杂
因此,建议建模时只用于解决某些小问题,而不要作为大题的思路。
案例:
适用:
最优选择,方案排序
参考
https://zhuanlan.zhihu.com/p/112194954
https://wiki.mbalib.com/wiki/%E5%A4%9A%E5%B1%9E%E6%80%A7%E5%86%B3%E7%AD%96
https://blog.csdn.net/qq_25601345/article/details/107733598
3、灰色预测模型
通过少量的、不完全的信息,建立数学模型并做出预测的一种预测方法.
目前常用的一些预测方法(如回归分析等),需要较大的样本.若样本较小,常造成较大误差,使预测目标失效.灰色预测模型所需建模信息少,运算方便,建模精度高,在各种预测领域都有着广泛的应用,是处理小样本预测问题的有效工具
是黑箱概念的一种推广。我们把既含有已知信息又含有未知信息的系统称为灰色系统.作为两个极端,我们将称信息完全未确定的系统为黑色系统;称信息完全确定的系统为白色系统.区别白色系统与黑色系统的重要标志是系统各因素之间是否具有确定的关系。
特点:
(1)用灰色数学处理不确定量,使之量化.
(2)充分利用已知信息寻求系统的运动规律.
(3)灰色系统理论能处理贫信息系统.
分类
①灰色时间序列预测;即用观察到的反映预测对象特征的时间序列来构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。
②畸变预测;即通过灰色模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
③系统预测;通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化。
④拓扑预测;将原始数据作曲线,在曲线上按定值寻找该定值发生的所有时点,并以该定值为框架构成时点数列,然后建立模型预测该定值所发生的时点。
参考
https://baike.baidu.com/item/%E7%81%B0%E8%89%B2%E9%A2%84%E6%B5%8B
https://zhuanlan.zhihu.com/p/72746735
4、图论模型
Dijkstra算法是由荷兰计算机科学家狄克斯特拉(Dijkstra)于1959 年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题。
其基本原理是:每次新扩展一个距离最短的点,更新与其相邻的点的距离。当所有边权都为正时,由于不会存在一个距离更短的没扩展过的点,所以这个点的距离永远不会再被改变,因而保证了算法的正确性。不过根据这个原理,用Dijkstra求最短路的图不能有负权边,因为扩展到负权边的时候会产生更短的距离,有可能就破坏了已经更新的点距离不会改变的性质。
举例来说,如果图中的顶点表示城市,而边上的权重表示著城市间开车行经的距离。 Dijkstra算法可以用来找到两个城市之间的最短路径。
参考
https://wiki.mbalib.com/wiki/Dijkstra%E7%AE%97%E6%B3%95
5、图论模型-Floyd算法
和Dijkstra 算法一样,弗洛伊德(Floyd)算法也是一种用于寻找给定的加权图中顶点间最短路径的算法。该算法名称以创始人之一、1978 年图灵奖获得者、斯坦福大学计算机科学系教授罗伯特·弗洛伊德命名
弗洛伊德算法(Floyd)计算图中各个顶点之间的最短路径
迪杰斯特拉算法用于计算图中某一个顶点到其他顶点的最短路径。
参考
https://blog.csdn.net/weixin_46168350/article/details/109644858
6、模拟退火模型
模仿自然界退火现象而得,利用了物理中固体物质的退火过程与一般优化问题的相似性从某一初始温度开始,伴随温度的不断下降,结合概率突跳特性在解空间中随机寻找全局最优解
模拟退火算法的模拟要求:
1初始温度足够高
2降温过程足够慢
3终止温度足够低
7、种群竞争模型
当两个种群为争夺同一食物来源和生存空间相互竞争时,常见的结局是,竞争力弱的灭绝,竞争力强的达到环境容许的最大容量。
使用种群竞争模型可以描述两个种群相互竞争的过程,分析产生各种结局的条件。
8、排队论模型
排队论发源于上世纪初。当时美国贝尔电话公司发明了自动电话,以适应日益繁忙的工商业电话通讯需要。这个新发明带来了一个新问题,即通话线路与电话用户呼叫的数量关系应如何妥善解决,这个问题久久未能解决。
排队论 (queuing theory),或称随机服务系统理论, 是通过对服务对象到来及服务时间的统计研究,得出这些数量指标(等待时间、排队长度、忙期长短等)的统计规律,然后根据这些规律来改进服务系统的结构或重新组织被服务对象,使得服务系统既能满足服务对象的需要,又能使机构的费用最经济或某些指标最优。它是数学运筹学的分支学科,也是研究服务系统中排队现象随机规律的学科。广泛应用于计算机网络、生产、运输、库存等各项资源共享的随机服务系统。 排队论研究的内容有 3 个方面:统计推断,根据资料建立模型;系统的性态,即和排队有关的数量指标的概率规律性;系统的优化问题。其目的是正确设计和有效运行各个服务系统,使之发挥最佳效益。
9、线性规划模型
线性规划(Linear Programming;LP)是数学规划的1个重要分支,专门研究线性规划问题,即在1组线性约束条件的限制下,求1个线性目标函数的最大或最小值的问题。
线性规划所研究的是:在一定条件下,合理安排人力物力等资源,使经济效果达到最好.一般地,求线性目标函数在线性约束条件下的最大值或最小值的问题,统称为线性规划问题。满足线性约束条件的解叫做可行解,由所有可行解组成的集合叫做可行域。决策变量、约束条件、目标函数是线性规划的三要素。
10、非线性规划与01规划模型
一: 线性规划与非线性规划区别
1.约束条件不同
线性规划主要是由确定的等式构成方程组,去求解目标函数的极值问题,全是线性成分(一次式)
而非线性规划构成的方程组并不是等式,而是不等式,通过不等式的约束条件,去求解目标函数的极值。(有非线性成分,例如平方)
2.最优解范围不同
如果最优解存在,线性规划只能存在可行域的边界上找到(一般还是在顶点处),而非线性规划的最优解可能存在于可行域的任意一点达到。
二:0-1规划
01规划是指:未知量的取值范围只能是0,1的规划问题,通常是线性规划
主要解决问题:多个人做一项工作,只能由一人做的规划问题
11、主成分分析
主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。
主成分与原始变量之间的关系:
(1)主成分保留了原始变量绝大多数信息。
(2)主成分的个数大大少于原始变量的数目。
(3)各个主成分之间互不相关。
(4)每个主成分都是原始变量的线性组合。
12、聚类分析
聚类分析是统计学中研究这种“物以类聚”问题的一种有效方法,它属于统计分析的范畴。聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。这里所说的类就是一个具有相似性的个体的集合,不同类之间具有明显的区别。
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。因此我们说聚类分析是一种探索性的分析方法。
聚类分析是一种无监督的分类方法,即不预先指定类别。根据分类对象不同,聚类分析可以分为样本聚类(Q型)和变量聚类(R型)。样本聚类是针对观测样本进行分类,而变量聚类则是试图找出彼此独立且有代表性的自变量,而又不丢失大部分信息。变量聚类是一种降维的方法。
2.2.1 系统聚类法(分层聚类法)
基本思想:开始将每个样本自成一类;然后求两两之间的距离,将距离最近的两类合成一类;如此重复,直到所有样本都合为一类为止。
适用范围:既适用于样本聚类,也适用于变量聚类。并且距离分类准则和距离计算方法都有多种,可以依据具体情形选择。
2.2.2 快速聚类法(K-均值聚类法)
基本思想:按照指定分类数目,选择个初始聚类中心;计算每个观测量(样本)到各个聚类中心的距离,按照就近原则将其分别分到放入各类中;重新计算聚类中心,继续以上步骤;满足停止条件时(如最大迭代次数等)则停止。
使用范围:要求用户给定分类数目,只适用于样本聚类(Q型),不适用于变量聚类(R型)。
2.2.3 两步聚类法(智能聚类方法)
基本思想:先进行预聚类,然后再进行正式聚类。
适用范围:属于智能聚类方法,用于解决海量数据或者具有复杂类别结构的聚类分析问题。可以同时处理离散和连续变量,自动选择聚类数,可以处理超大样本量的数据。
2.2.4 模糊聚类分析
2.2.5 与遗传算法、神经网络或灰色理论联合的聚类方法
13、多元回归分析
回归分析定义:
回归分析是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。
基本思想:根据历史数据的变化规律,寻找自变量与因变量之间的回归方程式,确定模型参数,据此预测。回归问题分为一元和多元回归、线性和非线性回归。
特点:技术比较成熟,预测过程简单;将预测对象的影响因素分解,考察各因素的变化情况,从而估计预测对象未来的数量状态;回归模型误差较大,外推特性差。
适用范围:回归分析法一般适用于中期预测。回归分析法要求样本量大且要求样本有较好的分布规律,当预测的长度大于占有的原始数据长度时,采用该方法进行预测在理论上不能保证预测结果的精度。另外,可能出现量化结果与定性分析结果不符的现象,有时难以找到合适的回归方程类型。