Python实现熵权法(正负指标)并计算综合评分—————附增完整代码和测试用例

本文链接：https://blog.csdn.net/qq_33375598/article/details/116140848

本文介绍了一种使用Python实现的熵权法，该方法能够处理正向和负向指标，并计算出权重及综合评分。文章提供了详细的代码示例和运行结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

0 背景
1 原理
2 代码实现

0 背景

因为最近在用python做数据科学方面的内容，在网上查看了很多Python的熵权法实现，没有发现一个令人满意的实现。很多都无法运行，或者是只针对正向指标，或者是只计算权重，没有计算综合评分。基于以上的原因，在参考一些博主的代码后，自己完善了上面的缺点。运行结果如下图所示，可以显示原始数据、归一化后的结果、参数的熵、每个物件的评分，平均评分、权重信息。

结果：

原始数据：        a       b       c       d
0  0.5537  0.3047  0.0000  0.3207
1  0.5221  0.4371  0.1851  0.3282
2  0.5133  0.3436 -0.0288  0.3321
3  0.5688  0.5225  0.3011  0.3365
4  0.5498  1.0353 -0.1522  0.3302
5  0.5104  0.9051  0.1549  0.3424
label:{'a': 1, 'b': 2, 'c': 1, 'd': 1}
标准化：          a         b         c         d
0  0.741438  1.000000  0.335760  0.000000
1  0.200342  0.818779  0.744099  0.345622
2  0.049658  0.946756  0.272226  0.525346
3  1.000000  0.701889  1.000000  0.728111
4  0.674658  0.000000  0.000000  0.437788
5  0.000000  0.178210  0.677476  1.000000
参数的熵          a         b         c         d
0  0.278099  0.274301  0.110828  0.000000
1  0.075145  0.224592  0.245613  0.113809
2  0.018626  0.259696  0.089857  0.172989
3  0.375080  0.192529  0.330081  0.239757
4  0.253051  0.000000  0.000000  0.144158
5  0.000000  0.048883  0.223622  0.329287
record:[56.16, 48.96, 39.51, 87.92, 32.54, 39.0]
record_average:50.68
     weight
a  0.353495
b  0.224368
c  0.223704
d  0.198433

1 原理

在这里插入图片描述

1.1 标准化

在这里插入图片描述

1.2 信息熵

在这里插入图片描述

1.3 权重

在这里插入图片描述

1.4 计算评分

在这里插入图片描述

2 代码实现

其实代码就是上面公式的实现，具体代码如下：

import pandas as pd
import numpy as np
import math
from numpy import array
import copy

# 熵值法函数 求指标权重
def cal_entropy_weight(x, label = dict()):
    '''熵值法计算变量的权重'''
    print('原始数据：'+ str(x))
    # 获得表的列头
    x_header = x.keys()
    # 初始化默认的label：1为正向指标 2 为负向指标
    if len(label) == 0:
        for key in x_header:
            label[key] = 1
    print('label:'+str(label))
    # 标准化
    for key in label:
        # 得到列最大和最小
        maxium = np.max(x[key], axis=0)
        minium = np.min(x[key], axis=0)
        # print('maxium:' + str(maxium))
        # print('minium:' + str(minium))
        if label[key] == 1:# 正向指标
            x[key] = x.loc[:, key].apply(lambda x: ((x - minium) / (maxium - minium)))
            # x[key].apply(lambda x: ((x - maxium) / (np.max(x) - np.min(x))))
        elif label[key] == 2: # 负向指标
            x[key] = x.loc[:, key].apply(lambda x: ((maxium - x) / (maxium - minium)))
        else:
            print('输入的数据标签有误！')
            return
        # x_standardized.append(pd.DataFrame({key:temp_x}), ignore_index=True)

    # print('x_standardized:' + str(x))
    # 真向标准化
    # x = x.apply(lambda x: ((x - np.min(x)) / (np.max(x) - np.min(x))))
    # 负向标准化
    # x = x.apply(lambda x: ((np.max(x) - x) / (np.max(x) - np.min(x))))
    # 获得标准化的表中的值
    x_standardized_data = list(x.to_dict().values())
    print('标准化：' + str(x))

    # 求k
    rows = x.index.size  # 行
    cols = x.columns.size  # 列
    k = 1.0 / math.log(rows)
    lnf = [[None] * cols for i in range(rows)]
    # 矩阵计算--
    # 信息熵
    # p=array(p)
    x = array(x)
    lnf = [[None] * cols for i in range(rows)]
    lnf = array(lnf)
    # p_arry = array()
    temp_p_list = list()
    p_row_list = list()
    for i in range(0, rows):
        for j in range(0, cols):
            if x[i][j] == 0:
                lnfij = 0.0
                p_row_list.append(0.0000)
            else:
                p = x[i][j] / x.sum(axis=0)[j]
                # print(type(p))
                p_row_list.append(p)
                lnfij = math.log(p) * p * (-k)
            lnf[i][j] = lnfij
        temp_p_list.append(copy.deepcopy(p_row_list))
        p_row_list.clear()
    # 行列转置
    p_list = [[r[col] for r in temp_p_list] for col in range(len(temp_p_list[0]))]
    p_dict = dict()
    p_num = 0
    for k in x_header:
        p_dict[k] = p_list[p_num]
        p_num += 1
    p_df = pd.DataFrame(p_dict)
    # print(p_list)
    print('参数的熵' + str(p_df))
    lnf = pd.DataFrame(lnf)
    E = lnf
    # 计算冗余度
    d = 1 - E.sum(axis=0)
    # 计算各指标的权重
    w = [[None] * 1 for i in range(cols)]
    for j in range(0, cols):
        wj = d[j] / sum(d)
        w[j] = wj
     # 计算各样本的综合得分,用标准化后的数据   
    record_row = 0.0
    record = list()
    record_sum = 0.00
    x_standardized_data =  [[r[col] for r in x_standardized_data] for col in range(len(x_standardized_data[0]))]
    # print('转置后的标准化:'+str(x_original_data))
    for i in range(len(x_standardized_data)):
        for j in range(len(x_standardized_data[i])):
            # print('x_original_data[i][j]' + str(x_original_data[i][j]))
            # print('w:' + str(w[i]))
            record_sum += x_standardized_data[i][j]*w[j]
            record_row += x_standardized_data[i][j]*w[j]
        # print('record_row:' + str(round(record_row, 2)))
        record.append(round(record_row * 100, 2))
        record_row = 0.0
    print('record:' + str(record))
    record_average = round(record_sum/len(record)*100, 2)
    print('record_average:' + str(record_average))
    w = pd.DataFrame(w)
    return w

测试数据：

a = {'1': 0.5537, '2': 0.5221, '3': 0.5133, '4': 0.5688, '5': 0.5498, '6': 0.5104}
b = {'1': 0.3047, '2': 0.4371, '3': 0.3436, '4': 0.5225, '5': 1.0353, '6': 0.9051}
c = {'1': 0.0000, '2': 0.1851, '3': -0.0288, '4': 0.3011, '5': -0.1522, '6': 0.1549}
d = {'1': 0.3207, '2': 0.3282, '3': 0.3321, '4': 0.3365, '5': 0.3302, '6': 0.3424}
deal_b= dict()
for key, value in b.items():
    deal_b[key] = abs(b[key] - 1)
data = {'a':list(a.values()), 'b':list(b.values()), 'c':list(c.values()), 'd':list(d.values())}
label = {'a':1, 'b':2, 'c':1, 'd':1}

# # 求熵权法
df = pd.DataFrame(data)
df.dropna()
w = cal_entropy_weight(df, label)  # 调用cal_weight
w.index = df.columns
w.columns = ['weight']
print(w)