基于熵权法对TOPSIS模型的修正

听风起

已于 2023-11-12 01:59:16 修改

阅读量190

点赞数 1

分类专栏：数学建模文章标签：数学建模

于 2023-10-05 21:43:43 首次发布

本文链接：https://blog.csdn.net/2303_76664877/article/details/133588061

版权

数学建模专栏收录该内容

22 篇文章 0 订阅

订阅专栏

上一次我们提到使用层次分析法给指标确定权重的方法太过于主观，使用熵权法可以客观一点的进行赋值，我们就来讲述一下熵权法的应用。

从定义中我们可以看到两个新名词，一个是变异程度，一个是信息量，信息量顾名思义，那么什么是变异程度呢？可以简单的理解成数据的偏差程度（即方差或标准差）。

到这里我们引出了熵权法的一个重要概念——信息熵，那么，信息熵越大，信息量是越大还是越小呢，我们可以看知乎的一篇高赞回答。

我们已经了解了熵权法的基本概念，那么给出熵权法的计算步骤。

到这里，我们再来讨论一下熵权法。熵权法是不是能降低层次分析法的主观性，我觉得还是有待商榷。我们可以简单的将这个方法理解为方差越大的指标权重就越大，这其实是不科学的。

其实，不管是什么评价指标，实际上都是不客观的，因为模型的参数都是我们自己定的。

熵权法就是不用我们自己定权重，样本数据自己的分布决定了权重，这样看起来可能会比较客观一点。但举一个简单的例子，我们有X、Y两个指标，用于评定班上谁是三好学生，X表示大家违纪上档案的次数，Y表示大家逃课的次数。我们按照常理来讲都会觉得X对评定的影响程度大，但是几乎所有的同学X都是0，就意味着X的方差为0，这个时候如果用熵权法来确定X的权重，绝对会很小，几乎所有人的X都是0，也就意味着忽略这个指标也是没有太大影响的，但万一真的有人这个违纪了，但他没有迟到，那么我们应该把三好学生让给他吗？

最后在上一节代码的基础上给出熵权法的matlab代码实现。。

%% 第一步：把数据复制到工作区，并将这个矩阵命名为X
% （1）在工作区右键，点击新建（Ctrl+N），输入变量名称为X
% （2）在Excel中复制数据，再回到Matlab中右键，点击粘贴Excel数据（Ctrl+Shift+V）
% （3）关掉这个窗口，点击X变量，右键另存为，保存为mat文件（下次就不用复制粘贴了，只需使用load命令即可加载数据）
% （4）注意，代码和数据要放在同一个目录下哦，且Matlab的当前文件夹也要是这个目录。
clear;clc
load data_water_quality.mat
%% 第二步：判断是否需要正向化
[n,m]=size(X);
disp(['共有' num2str(n) '个评价对象,' num2str(m) '个评价指标'])
Judge=input(['这' num2str(m) '个评价指标是否需要经过正向化处理，需要请输入1，不需要输入0：  ']);

if Judge==1
    Position=input('请输入需要正向化处理的指标所在的列，例如第2、3、6三列需要处理，那么你需要输入[2,3,6]: ');
    disp('请输入需要处理的这些列的指标类型（1：极小型，2：中间型，3：区间型）')
    Type=input('例如：第2列是极小型，第3列是区间型，第6列是中间型，就输入[1,3,2]： ');
    % 注意，Position和Type是两个同维度的行向量
    for i=1:size(Position,2) %这里需要对这些列分别处理，因此我们需要知道一共要处理的次数，即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数，其作用是进行正向化，其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))  X(:,n)表示取第n列的全部元素
    % 第二个参数是对应这一列的指标类型（1：极小型，2：中间型，3：区间型）
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值，它返回正向化之后的指标，我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X= ')
    disp(X)
end
%% 第四步：让用户判断是否需要增加权重
disp('请输入是否需要增加权重向量，需要输入1，不需要输入0 ')
Judge = input('请输入是否需要增加权重： ');
if Judge == 1
    Judge = input('使用熵权法确定权重请输入1，否则输入0： ');
    if Judge == 1
        if sum(sum(Z<0)) > 0 %如果之前标准化后的Z矩阵中存在负数，则重新对X进行标准化
            disp('原来标准化得到的Z矩阵中存在负数，所以需要对X重新标准化')
            for i = 1:n
                for j = 1:m
                    Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
                end
            end
            disp('X重新进行标准化得到的标准化矩阵Z为：')
            disp(Z)
        end
        weight = Entropy_Method(Z);
        disp('熵权法确定的权重为： ')
        disp(weight)
    else
        disp(['如果你有3个指标，你就需要输入3个权重，例如它们分别为0.25，0.25，0.5，则你需要输入[0.25,0.25,0.5]']);
        weigh = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重:' ]);
        OK = 0; %用来判断用户的输入格式是否正确
        while OK == 0
            if abs(sum(weigh) - 1)<0.000001 && size(weigh,1) == 1 && size(weigh,2) == m %这里注意浮点数的运算是不精确的
                OK = 1;
            else
                weigh = input('你输入的有误，请重新输入权重行向量：');
            end
        end
    end
else
    weigh = ones(1,m) ./ m; %如果不需要加权重就默认权重都相同，即都为1/m
end

%% 第三步：对正向化后的矩阵进行标准化
Z=X ./ repmat(sum(X .*X) .^0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)

%% 第五步：计算与最大值的距离和最小值的距离，并算出得分
D_P=sum([(Z - repmat(max(Z),n,1)) .^ 2] .* repmat(weight,n,1) ,2) .^ 0.5; %D+与最大值的距离向量
D_N=sum([(Z - repmat(min(Z),n,1)) .^ 2] .* repmat(weight,n,1) ,2) .^ 0.5; %D-与最小值的距离向量
S = D_N ./ (D_P+D_N); %未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S);
[sorted_S,index] = sort(stand_S ,'descend');

% sort(A)若A是向量不管是列还是行向量，默认都是对A进行升序排列。sort(A)是默认的升序，而sort(A,'descend')是降序排序。
% sort(A)若A是矩阵，默认对A的各列进行升序排列
% sort(A,dim)
% dim=1时等效sort(A)
% dim=2时表示对A中的各行元素升序排列
% A = [2,1,3,8]
% Matlab中给一维向量排序是使用sort函数：sort（A），排序是按升序进行的，其中A为待排序的向量；
% 若欲保留排列前的索引，则可用 [sA,index] = sort(A,'descend') ，排序后，sA是排序好的向量，index是向量sA中对A的索引。
% sA  =  8     3     2     1
% index =  4     3     1     2

在该代码中我们新定义了两个函数my_log()和Entropy_Method()，也给出相应的代码。

% 重新定义一个mylog函数，当输入的p中元素为0时，返回0
function [lnp] = mylog(p)
n= length(p); %向量的长度
lnp = zeros(n,1); %初始化最后的结果
    for i = 1:n % 开始循环
        if p(i) == 0 % 如果第i个元素为0
            lnp(i) = 0; % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));
        end
    end
end

function [W] = Entropy_Method(Z)
% 计算有n个样本，m个指标的样本所对应的熵权
% 输入
% Z：n*m的矩阵（需要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，1*m的行向量
% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m); %初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i); %取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); %计算信息熵
        D(i) = 1 - e; % 计算信息效用值
    end
    W= D ./ sum(D); % 将信息效用值归一化，得到权重
end

听风起

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
基于熵权法对TOPSIS模型的修正

我们按照常理来讲都会觉得X对评定的影响程度大，但是几乎所有的同学X都是0，就意味着X的方差为0，这个时候如果用熵权法来确定X的权重，绝对会很小，几乎所有人的X都是0，也就意味着忽略这个指标也是没有太大影响的，但万一真的有人这个违纪了，但他没有迟到，那么我们应该把三好学生让给他吗？到这里，我们再来讨论一下熵权法。到这里我们引出了熵权法的一个重要概念——信息熵，那么，信息熵越大，信息量是越大还是越小呢，我们可以看知乎的一篇高赞回答。其实，不管是什么评价指标，实际上都是不客观的，因为模型的参数都是我们自己定的。
复制链接

扫一扫