评价类模型-基于熵权法的Topsis模型★★★★

云上西

已于 2024-07-16 10:02:31 修改

阅读量2.2k

点赞数 29

分类专栏：数学建模清风建模文章标签：数学建模 python 机器学习开发语言人工智能

于 2024-07-15 08:00:00 首次发布

本文链接：https://blog.csdn.net/huahua121_/article/details/140419296

版权

数学建模同时被 2 个专栏收录

41 篇文章

订阅专栏

清风建模

29 篇文章

订阅专栏

该博客为个人学习清风建模的学习笔记，部分课程可以在B站：【强烈推荐】清风：数学建模算法、编程和写作培训的视频课程以及Matlab等软件教学_哔哩哔哩_bilibili

基于Topsis模型，本人写的笔记在：评价类模型-Topsis优劣解距离法-CSDN博客

名称	重要性	难度
基于熵权法对Topsis模型的修正	★★★★	★★★

1引入

评价问题中标准矩阵引入，需要确定权重：

层次分析法可以进行权重确定，但是层次分析法有局限性。

层次分析法最大的缺点：判断矩阵的确定依赖于专家，如果专家的判断存在主观性的话，会对结果产生很大的影响。（主观性太强）

因此引入新的方法来确认权重——熵权法。

2定义

2.1熵权法

熵权法是一种客观赋权方法

依据的原理： 指标的 变异程度 越小，所反映的信息量也越少，其对应的权值也应该越低。（客观 = 数据本身就可以告诉我们权重）

层次分析法的权重带有很重的主观色彩，而为了使权重更加客观，我们利用原始数据中的某些特性来确定权重。一列数据方差越小，指标的变异程度越小，所反映的信息量也越少，那么此时其权重就应该越低。而一列数据所反映的信息量越少，其信息熵就越大。所以指标的信息熵就是这样一个具有优良性质的特性。而且信息熵越大，权重就越低。（客观 = 数据本身就可以告诉我们权重）
熵权法只是一个确定权重的方法，一般和别的方法（如TOPSIS法）一起使用。
————————————————

原文链接：https://blog.csdn.net/m0_63669388/article/details/132182382

变异程度可以理解为方差或标准差。

（一种极端的例子：对于所有的样本而言，这个指标都是相同的数值，那么我们可认为这个指标的权值为0，即这个指标对于我们的评价起不到任何帮助）

2.2度量信息量

举例引入：

小张和小王是两个高中生。小张学习很差，而小王是全校前几名的尖子生。

高考结束后，小张和小王都考上了清华。小王考上了清华，大家都会觉得很正常，里

面没什么信息量，因为学习好上清华，天经地义，本来就应该如此的事情。

然而，如果是小张考上了清华，这就不一样了，这里面包含的信息量就非常大。怎么

说？因为小张学习那么差，怎么会考上清华呢？把不可能的事情变成可能，这里面就有很

多信息量。

注：本例子来自微信公众号：“小宇治水 ”

上面的小例子告诉我们：

越有可能发生的事情，信息量越少， 越不可能发生的事情，信息量就越多。

怎么衡量事情发生的可能性大小？ 概率

函数关系确立：

2.3信息熵

信息熵的本质就是对信息量的期望值

随机变量的信息熵越大，则它的值(内容)能给你补充的信息量越大，而知道这个值前你已有的信息量越小。

对于熵权法而言，因为我们关注的是已有的信息，所以 信息熵越大信息量越小 。

3步骤

（1）判断输入的矩阵中是否存在负数，如果有则要重新标准化到 非负区间 （后面计算概率时需要保证每一个元素为 非负数 ）

记得正向化、标准化！！

（ 2 ）计算第 j 项指标下第 i 个样本所占的比重，并将其看作相对熵计算中用到的概率

标准化的值除以该列的和

（ 3 ）计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权

信息效用值越大，信息量越多；信息熵越大，信息量越少。

4原理

熵权法是一种客观赋权方法

依据的原理： 指标的 变异程度 越小，所反映的信息量也越少，其对应的权值也应该越低。（客观 = 数据本身就可以告诉我们权重）

5代码

代码摘自清风老师

function [W] = Entropy_Method(Z)
% 计算有n个样本，m个指标的样本所对应的的熵权
% 输入
% Z ： n*m的矩阵（要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，1*m的行向量

%% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化，得到权重    
end

% 重新定义一个mylog函数，当输入的p中元素为0时，返回0
function [lnp] =  mylog(p)
n = length(p);   % 向量的长度
lnp = zeros(n,1);   % 初始化最后的结果
    for i = 1:n   % 开始循环
        if p(i) == 0   % 如果第i个元素为0
            lnp(i) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));  
        end
    end
end

6总结

基于熵权法的Topsis模型是对Topsis模型的补充，因为层次分析法具有较大的主观色彩，对于最终得分来说，缺乏客观性，而熵权法是基于数据本身进行分析，所以更加推荐使用熵权法。使用步骤与Topsis模型差不多，但是引入新的指标——信息效用值来评价问题，将信息效用值归一化后，再计算对于的权重。熵权法只是一个确定权重的方法，一般和别的方法（如TOPSIS法）一起使用。