Topsis
原理
其基本原理,是通过检测评价对象与最优解、最劣解的距离来进行排序,若评价对象最靠近最优解同时又最远离最劣解,则为最好;否则不为最优。其中最优解的各指标值都达到各评价指标的最优值。最劣解的各指标值都达到各评价指标的最差值。它是一种常用的综合评价方法,能充分利用原始数据的信息,其结果可以精确地反映各评价方案之间的差距。
引例
我们想通过四名同学的高数成绩对他们评分,
姓名 | 成绩 | 排名 | 修正后排名 | 得分 |
---|---|---|---|---|
小明 | 89 | 2 | 3 | 3\10=0.3 |
小王 | 96 | 1 | 4 | 4\10=0.4 |
小李 | 60 | 4 | 1 | 1\10=0.1 |
小赵 | 75 | 3 | 2 | 2\10=0.2 |
但是倘若成绩变化如下,
姓名 | 成绩 | 排名 | 修正后排名 | 得分 |
---|---|---|---|---|
小明 | 89 | 2 | 3 | 3\10=0.3 |
小王 | 1 | 4 | 4\10=0.4 | |
小李 | 4 | 1 | 1\10=0.1 | |
小赵 | 75 | 3 | 2 | 2\10=0.2 |
很明显,只要四名同学的排名不变,得分就不会发生改变,所以这样的打分方式还不够严谨。
于是我们构造公式
d = x − m i n m a x − m i n d=\frac{x-min}{max-min} d=max−minx−min
姓名 | 成绩 | 排名 | 修正后排名 | 得分 |
---|---|---|---|---|
小明 | 89 | 2 | 3 | (89-60)\(96-60)=0.81 |
小王 | 96 | 1 | 4 | (96-60)\(96-60)=1 |
小李 | 60 | 4 | 1 | (60-60)\(96-60)=0 |
小赵 | 75 | 3 | 2 | (75-60)\(96-60)=0.42 |
步骤
- 正向化指标
在引例中,我们不难发现“成绩”是越高越好,“排名”是越小越好,我们在计算时习惯性的认为得分越高越好,所以如果我们在利用排名进行得分时需要加以修正,即指标正向化。
指标类型 | 指标特点 | 举例 | 转换成极大型指标 |
---|---|---|---|
极大型指标 | 越大越好 | 成绩、GDP、利润 | \ |
极小型指标 | 越小越好 | 空气污染指数、费用 | m a x − x max-x max−x或者 1 x \frac{1}{x} x1 |
中间型指标 | 越接近某个值越好 | 吉他的调音 | x ~ = 1 − ∣ x i − x b e s t ∣ ∣ x m a x − x b e s t ∣ \tilde{x}=1-\frac{\mid x_i-x_{best}\mid}{\mid x_{max}-x_{best}\mid} x~=1−∣xmax−xbest∣∣xi−xbest∣ |
区间型指标 | 落在某个区间最好 | 体温、池塘里的含氧量 | (见下文) |
区间型指标正向化:
{ x i } \{x_i\} {
xi}是一组区间型指标序列,且最佳区间为[a,b],则
M = m a x { a − m i n { x i } , m a x { x i } − b } M=max\{a-min\{x_i\},max\{x_i\}-b\} M=max{
a−min{
xi},max{
xi}−b}
x ~ i = { 1 − a − x i M x i < a 1 a ≤ x i ≤ b 1 − x i − b M x i > b \tilde{x}_i=\begin{cases} 1-\dfrac{a-x_i}{M}& x_i<a\\ 1& a\leq{x_i}\leq{b}\\1-\dfrac{x_i-b}{M}&x_i>b \end{cases} x~i=⎩⎪⎪⎪⎨⎪⎪⎪⎧1−Ma−xi11−Mxi−bxi<aa≤xi≤bxi>b
2. 标准化数据