二、数学建模优劣分析法（TOPSIS法）【清风数学建模个人笔记】

小赵研究生已考上

已于 2022-02-10 12:53:57 修改

阅读量4.7k

点赞数 7

分类专栏：数学建模文章标签：算法

于 2022-01-23 21:10:17 首次发布

本文链接：https://blog.csdn.net/m0_58882109/article/details/122656345

版权

数学建模专栏收录该内容

9 篇文章 6 订阅

订阅专栏

层次分析法的局限

（1）评价的决策层不能太多，太多的话n会很大，判断矩阵和一致矩阵差异
可能会很大。平均随机一致性指标RI的表格中n最多是15。
（2）如果决策层中指标的数据是已知的，那么我们如何利用这些数据来使得
评价的更加准确呢？

TOPSIS法主要思想

引入

已知四位同学的成绩，请给出一个评分，该评分能合理的描述其成绩的高低。（这里要求的评分可以类比之前学过的层次分析法中的那个权重）

我们首先想到下面一种做法：

但是这种做法可以随意修改成绩，只要排名不变，那么评分就不会改变。

所以这里我们提出一种更好的做法

最高成绩MAX：99，最低成绩MIN：60

构造计算评分的公式： $\frac{x-min}{max-min}$

缺点是最低分和最高分为固定值0和1。但是如果我们比较的人数较多，这两个人的评分就不会影响大局。

现在我们再来拓展一下，再增加一个指标，如下：

成绩是越高（大）越好，这样的指标称为极大型指标（效益型指标）。

与他人争吵的次数越少（越小）越好，这样的指标称为极小型指标（成本型指标）。

统一指标类型

为了能统一的分析，我们需要将所有的指标转化为极大型称为指标正向化（最常用）

#如果用到该方法要写到论文里

极小型指标转换为极大型指标的公式： $max - x$

标准化处理

成绩的单位为分，争吵次数的单位为次，为了消去不同指标量纲的影响，需要对已经正向化的矩阵进行标准化处理。（成绩的单位为分，争吵次数的单位为次，为了消去不同指标量纲的影响，需要对已经正向化的矩阵进行标准化处理。）

上图所示，四个评价对象，两个评价指标

标准化处理的计算公式：

如何计算得分

只有一个指标

因为只有一个指标，所以矩阵为n行一列。

构造计算评分的公式 $\frac{x - min}{max - min}$

这个公式可以看做

多个指标

有多个指标时，我们可以类比只有一个指标计算得分

有n个要评价的对象，m个评价指标时，Z为n行m列

最小值（最大值）为分别把每一列的最小值（最大值）拿出来构成一个向量

距离为欧氏距离，用最大值减去它里面的每一个元素的平方后按行求和开根号

当 $D_{i}^{-}$ = 0时，得分 $S_{i}$ 为0，即第i个对象为最小值时，当 $D_{i}^{+}$ = 0时，得分 $S_{i}$ 为0，即第i个评价对象为最大值时

计算得分

TOPSIS法步骤

第一步：将原是矩阵正向化

#注意：正向化的公式不唯一，大家可以结合自己的数据进行适当地修改

常见的四种指标

所谓的将原始矩阵正向化，就是要将所有的指标类型统一转化为 极大型指标。 （转换的函数形式可以不唯一哦 ~

极小型->极大型

极小型指标转换为极大型指标的公式： $max - x$

如果所有的元素均为正数，那么也可以使用 $\frac{1}{x}$

中间型->极大型

{ ${x}_{i}$ }是一组中间型指标序列，且最佳的数值为，那么正向化的公式如下

例：

区间型->极大型

{ ${x}_{i}$ }是一组区间型指标序列，且最佳的区间为[a,b]，那么正向化公式如下

第二步：正向化矩阵标准化

标准化的目的是消除不同指标量纲的影响。

注意：标准化的方法有很多种，其主要目的就是去除量纲的影响，未来我们还可能见到更多

种的标准化方法，例如：(x‐x的均值)/x的标准差；具体选用哪一种标准化的方法在多数情况下

并没有很大的限制，这里我们采用的是前人的论文中用的比较多的一种标准化方法。

第三步：计算得分并归一化

注意：要区别开归一化和标准化。归一化的计算步骤也可以消去量纲的影响，但更多时候，我们进行归一化的目的是为了让我们的结果更容易解释，或者说让我们对结果有一个更加清晰直观的印象。例如将得分归一化后可限制在0‐1这个区间，对于区间内的每一个得分，我们很容易的得到其所处的比例位置。

注意：这里还没有考虑指标的权重，后面的内容会考虑指标的权重来进行计算

带权重的TOPSIS法

上文所讲的例子均默认了指标的权重相同，权重不同时，我们应该加上权重，对上文方法稍作更改

各个指标的权重如何判断呢？这时就用到我们之前学过的层次分析法

但是层次分析法主观性太强

Topsis代码详解

主函数

%%  第一步：把数据复制到工作区，并将这个矩阵命名为X
  clear;clc
load data_water_quality.mat
%% 注意：如果提示: 错误使用 load，无法读取文件 'data_water_quality.mat'。没有此类文件或目录。
% 那么原因是因为你的Matlab的当前文件夹中不存在这个文件
% 可以使用cd函数修改Matlab的当前文件夹

%%  第二步：判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) %字符串拼接
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理，需要请输入1 ，不需要输入0：  ']);

if Judge == 1
    Position = input('请输入需要正向化处理的指标所在的列，例如第2、3、6三列需要处理，那么你需要输入[2,3,6]： '); %[2,3,4]
    disp('请输入需要处理的这些列的指标类型（1：极小型， 2：中间型， 3：区间型） ')
    Type = input('例如：第2列是极小型，第3列是区间型，第6列是中间型，就输入[1,3,2]：  '); %[2,1,3]
    % 注意，Position和Type是两个同维度的行向量
    for i = 1 : size(Position,2)  %这里需要对这些列分别处理，因此我们需要知道一共要处理的次数，即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数，其作用是进行正向化，其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识，X(:,n)表示取第n列的全部元素
    % 第二个参数是对应的这一列的指标类型（1：极小型， 2：中间型， 3：区间型）
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值，它返回正向化之后的指标，我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)%正向化后的矩阵后可以放在论文附录中
end

%% 第三步：对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);%每个元素都除以其根下所在列元素平方和 
disp('标准化矩阵 Z = ')
disp(Z)

%% 第四步：计算与最大值的距离和最小值的距离，并算出得分
D_P = sum([(repmat(max(Z),n,1)) .^ 2 - Z],2) .^ 0.5;   % D+ 与最大值的距离向量
D_N = sum([(repmat(min(Z),n,1)) .^ 2 - Z],2) .^ 0.5;   % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S)  %归一化后的得分
[sorted_S,index] = sort(stand_S ,'descend')%返回排序后的得分和索引

自定义函数Positivization

function [posit_x] = Positivization(x,type,i)
% 输入变量有三个：
% x：需要正向化处理的指标对应的原始列向量
% type： 指标的类型（1：极小型， 2：中间型， 3：区间型）
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示：正向化后的列向量
    if type == 1  %极小型
        disp(['第' num2str(i) '列是极小型，正在正向化'] )
        posit_x = Min2Max(x);  %调用Min2Max函数来正向化
        disp(['第' num2str(i) '列极小型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 2  %中间型
        disp(['第' num2str(i) '列是中间型'] )
        best = input('请输入最佳的那一个值： ');
        posit_x = Mid2Max(x,best);
        disp(['第' num2str(i) '列中间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 3  %区间型
        disp(['第' num2str(i) '列是区间型'] )
        a = input('请输入区间的下界： ');
        b = input('请输入区间的上界： '); 
        posit_x = Inter2Max(x,a,b);
        disp(['第' num2str(i) '列区间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    else
        disp('没有这种类型的指标，请检查Type向量中是否有除了1、2、3之外的其他值')
    end
end

自定义函数Min2Max

function [posit_x] = Min2Max(x)
    posit_x = max(x) - x;   %向量与常数做加减乘除相当于每一个元素对这个常数做加减乘除
     %posit_x = 1 ./ x;    %如果x全部都大于0，也可以这样正向化
end

自定义函数Mid2Max

function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));    %abs（）求绝对值
    posit_x = 1 - abs(x-best) / M;
end

自定义函数Inter2Max

function [posit_x] = Inter2Max(x,a,b)  %a,b为 上下界
    r_x = size(x,1);  % row of x 
    M = max([a-min(x),max(x)-b]);
    posit_x = zeros(r_x,1);   %zeros函数用法: zeros(3)  zeros(3,1)  ones(3)
    % 初始化posit_x全为0  初始化的目的是节省处理时间
    for i = 1: r_x
        if x(i) < a
           posit_x(i) = 1-(a-x(i))/M;
        elseif x(i) > b
           posit_x(i) = 1-(x(i)-b)/M;
        else
           posit_x(i) = 1;
        end
    end
end

基于熵权法对Topsis模型的修正

依据的原理： 指标的变异程度越小，所反映的信息量也越少，其对应的权值也应该越低。

（客观 = 数据本身就可以告诉我们权重）

【变异程度可理解为方差或标准差】【指标的标准差越大，其信息熵越小】

（一种极端的例子：对于所有的样本而言，这个指标都是相同的数值，那么我们可认为这个指标的权值为0，即这个指标对于我们的评价起不到任何帮助）

那么如何度量信息量的大小呢？越有可能发生的事情，信息量越少， 越不可能发生的事情，信息量就越多。

又怎样衡量事情发生的可能性大小呢？概率

如果把信息量用字母 I 表示，概率用p表示，那么我们可以将它们建立一个函数关系：

信息熵的定义

#对于熵权法而言，信息熵越大，信息量越小。

熵权法计算步骤

（1）判断输入的矩阵中是否存在负数，如果有则要重新标准化到非负区间（后面计算概率时需要保证每一个元素为非负数）

（2）计算第j项指标下第i个样本所占的比重，并将其看作相对熵计算中用到的概率

（3）计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权

熵权法部分代码

%%  第一步：把数据复制到工作区，并将这个矩阵命名为X
% （1）在工作区右键，点击新建（Ctrl+N)，输入变量名称为X
% （2）在Excel中复制数据，再回到Excel中右键，点击粘贴Excel数据（Ctrl+Shift+V）
% （3）关掉这个窗口，点击X变量，右键另存为，保存为mat文件（下次就不用复制粘贴了，只需使用load命令即可加载数据）
% （4）注意，代码和数据要放在同一个目录下哦。
clear;clc
load data_water_quality.mat

%%  第二步：判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) 
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理，需要请输入1 ，不需要输入0：  ']);

if Judge == 1
    Position = input('请输入需要正向化处理的指标所在的列，例如第2、3、6三列需要处理，那么你需要输入[2,3,6]： '); %[2,3,4]
    disp('请输入需要处理的这些列的指标类型（1：极小型， 2：中间型， 3：区间型） ')
    Type = input('例如：第2列是极小型，第3列是区间型，第6列是中间型，就输入[1,3,2]：  '); %[2,1,3]
    % 注意，Position和Type是两个同维度的行向量
    for i = 1 : size(Position,2)  %这里需要对这些列分别处理，因此我们需要知道一共要处理的次数，即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数，其作用是进行正向化，其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识，X(:,n)表示取第n列的全部元素
    % 第二个参数是对应的这一列的指标类型（1：极小型， 2：中间型， 3：区间型）
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值，它返回正向化之后的指标，我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)
end
%% 作业：在这里增加是否需要算加权
% 补充一个基础知识：m*n维的矩阵A 点乘 n维行向量B，等于这个A的每一行都点乘B
% （注意：2017以及之后版本的Matlab才支持，老版本Matlab会报错）
% % 假如原始数据为：
%   A=[1, 2, 3;
%        2, 4, 6] 
% % 权重矩阵为：
%   B=[ 0.2, 0.5 ,0.3 ] 
% % 加权后为：
%   C=A .* B
%     0.2000    1.0000    0.9000
%     0.4000    2.0000    1.8000
% 类似的，还有矩阵和向量的点除， 大家可以自己试试计算A ./ B
% 注意，矩阵和向量没有 .- 和 .+ 哦 ，大家可以试试，如果计算A.+B 和 A.-B会报什么错误。

%% 这里补充一个小插曲
% % 在上一讲层次分析法的代码中，我们可以优化以下的语句：
% % Sum_A = sum(A);
% % SUM_A = repmat(Sum_A,n,1);
% % Stand_A = A ./ SUM_A;
% % 事实上，我们把第三行换成：Stand_A = A ./ Sum_A; 也是可以的哦 
% % (再次强调，新版本的Matlab才能运行哦)

%% 第三步：对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)


%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量，需要输入1，不需要输入0")
Judge = input('请输入是否需要增加权重： ');
if Judge == 1
    Judge = input('使用熵权法确定权重请输入1，否则输入0： ');
    if Judge == 1
        if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数，则重新对X进行标准化
            disp('原来标准化得到的Z矩阵中存在负数，所以需要对X重新标准化')
            for i = 1:n
                for j = 1:m
                    Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
                end
            end
            disp('X重新进行标准化得到的标准化矩阵Z为:  ')
            disp(Z)
        end
        weight = Entropy_Method(Z);
        disp('熵权法确定的权重为：')
        disp(weight)
    else
        disp(['如果你有3个指标，你就需要输入3个权重，例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);
        weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);
        OK = 0;  % 用来判断用户的输入格式是否正确
        while OK == 0 
            if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意，Matlab中浮点数的比较要小心
                OK =1;
            else
                weight = input('你输入的有误，请重新输入权重行向量: ');
            end
        end
    end
else
    weight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同，即都为1/m
end


%% 第四步：计算与最大值的距离和最小值的距离，并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D+ 与最大值的距离向量
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')

% A = magic(5)  % 幻方矩阵
% M = magic(n)返回由1到n^2的整数构成并且总行数和总列数相等的n×n矩阵。阶次n必须为大于或等于3的标量。
% sort(A)若A是向量不管是列还是行向量，默认都是对A进行升序排列。sort(A)是默认的升序，而sort(A,'descend')是降序排序。
% sort(A)若A是矩阵，默认对A的各列进行升序排列
% sort(A,dim)
% dim=1时等效sort(A)
% dim=2时表示对A中的各行元素升序排列
% A = [2,1,3,8]
% Matlab中给一维向量排序是使用sort函数：sort（A），排序是按升序进行的，其中A为待排序的向量；
% 若欲保留排列前的索引，则可用 [sA,index] = sort(A,'descend') ，排序后，sA是排序好的向量，index是向量sA中对A的索引。
% sA  =  8     3     2     1
% index =  4     3     1     2

function [W] = Entropy_Method(Z)
% 计算有n个样本，m个指标的样本所对应的的熵权
% 输入
% Z ： n*m的矩阵（要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，m*1的行向量

%% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化，得到权重    
end

% 重新定义一个mylog函数，当输入的p中元素为0时，返回0
function [lnp] =  mylog(p)
n = length(p);   % 向量的长度
lnp = zeros(n,1);   % 初始化最后的结果
    for i = 1:n   % 开始循环
        if p(i) == 0   % 如果第i个元素为0
            lnp(i) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));  
        end
    end
end