topsis法能够充分利用原始数据的信息,其结果能够精确地反应各个评价方案之间的差距
该模型对于数据的分布及样本含量没有严格的限制,数据计算简单易行
以下是该模型的步骤
一、将原始矩阵正向化
就是将所有指标类型(级大型指标、级小型指标、中间型指标、区间型指标)统一转化成级大型指标(转化的函数不唯一)
二、正向化矩阵标准化
为了消除不同指标量纲的影响
三、计算每个指标的权重
用层次分析法或者熵权法
四、计算得分并且归一化
用向量来表示计算
z与最小值的距离/(z与最大值的距离+z与最小值的距离)
五、基于熵权法对topsis模型的修正
1.介绍
熵权法是一种客观的赋权方法=数据本身可以告诉我们权重
依据的原理:指标的变异程度越小,所反映的信息量也就越少,其对应的权值也应该越低
2.如何度量信息量的大小——信息熵的引入
越有可能发生的事情,信息量越少;越不可能发生的事情,信息量越大
用概率去衡量事情发生的可能性
定义:I(x) = - ln(p(x));
H(x) = 求和符号[p(xi)I(x)];信息熵的本质就是对信息量的期望
随机变量的信息熵越大,则他的值能给你补充的信息量就越大,尔知道这个值前你已有的信息量就越少
3.熵权法的计算步骤
i)将已经正向化、标准化的矩阵输入,判断是否存在负数,如果有要重新标准化到非负空间
i i)计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率
i i i)计算每个指标的信息熵,接着计算信息效用值,并归一化每个指标的熵权
信息熵:ej = -1/ln(n)求和符号[pij*ln(pij)]
信息效用值:dj = 1-ej. 信息效用值越大,其对应的信息就越多
每个指标的熵权法:wj = dj / 求和符号[dj]. (将信息效用值进行归一化)
4.对熵权法的一些理解
!!!一些需要注意的事项
我们可以用指标的标准差来衡量样本的变异程度,指标的标准差越大,其信息熵就越小
若x,y指标来评定班上谁是三好学生,x表示违纪档案的次数,y表示逃课次数,显然x所占权重应该更大,但是熵权法来定义则会得到y所占权重更大,因为x大家几乎都为零