一、TOPSIS法简介
TOPSIS全称为Technique for Order Preference by Similarity to Ideal Solution,逼近理想解排序法。
简单来说,就是将需要排序的对象转化为空间中的一个点(不一定是二维,也不一定是三维,和评价指标个数相关),有了这些点,计算这些点和理想中最优的点以及理想中最差的点的距离,然后来判断次序。
二、适用赛题
客观评估类型题目,这类题目提供了足够的评价指标和数据。在数据已知的情况下,评价指标的类型差异较大(数值、比值、百分比,且有正面指标也有负面指标)
模型特点
- 充分利用原始数据,求解结果能反映各方案与理想方案差异程度
- 在评价指标较多时避免了主观性造成的复杂过程
- 数据计算简单易行,无需数据检验
三、模型流程
四、流程解析
1.数据预处理
因为在当前指标数据中,并不都是越大越好,而且不同指标的单位不同、数量级不同,使得求点与点距离时对结果影响程度不同,所以使用TOPSIS法求不同点与理想解的距离,先要进行数据预处理。
这里将指标数据划分成三类
- 效益型属性:越大越好的属性,例如科研经费
- 成本型属性:越小越好的属性,例如延毕率
- 区间型属性:在某一区间内最好,过大或过小都不好,例如生师比
不同的类型有不同的处理方法
- 效益型属性无需处理
- 成本型属性,在代码求解时求正理想解时对其取最小值,求负理想解时对其取最大值(正负理想解在后面会讲到)
- 区间型属性,根据数据与最优区间的差异进行处理
所以需要立即处理的只有区间型属性
则有:
翻译下来就是
- 在最优属性区间内(最好的情况),值设为1;超出了可接受的范围,直接设为0
- 不在最优属性区间内、但是在还可接受的范围内,按公式改为0到1的值
在处理完区间型数据后,进行向量规范化
- 三个属性都用相同公式进行变换
- 规范化后的数值,同一属性值(评价指标)的平方和为1
得到规范化后的矩阵,因为不同指标的重要性不同,需要加权处理
- 与层次分析法的两两比较不同,TOPSIS法直接给每个指标加上权重(查文献、资料)
- 因为TOPSIS法充分利用了数据的差异,只要权重设置得不是太离谱,对结果影响不会太大
2.求解距离
TOPSIS法是求每个点到最优和最差理想解的距离
那么正理想解(最优)的各个指标是数据中最优的,负理想解(最差)的各个指标就是数据中最差的
然后求解每个点到正负理想解的距离
3.排序
有了距离就可以求得综合评价指数
- 显然,距离正理想解越近、距离负理想解越远越好
- 按综合评价指数从大到小排序,即为所求。
至此,求解完成。