熵权法计算
1.数据标准化
2.计算哥指标权重
3.计算各样本/行得分(此得分为用标准化数据计算而来,本人也有一篇文章是用原始数据计算分值,感兴趣可以参考)
4.结果输出
直接整理成一整块代码,之前代码为定义了权重函数和得分函数,因为自己用,代码量少,所以这个直接都放一起了,我觉得用标准化后的数据计算比较直观一些
# -*- encoding=utf-8 -*-
import warnings
warnings.filterwarnings("ignore")
import pandas as pd
import numpy as np
import os
os.chdir(r"E:\BaiduNetdiskDownload\数据") #指定路径
data = pd.read_excel("指标.xlsx", encoding='utf8')
data = data.iloc[:, 1:] #数据选择第二列开始,所有行
# 数据标准化
data = (data - data.min())/(data.max() - data.min())
#计算k
m,n = data.shape #m行k列
data1 = data.as_matrix(columns = None) #将dataframe格式转化为matrix格式/矩阵,为了使用方便在这将矩阵和dataframe格式的分别用一个变量
k = 1/np.log(m)
yij = data1.sum(axis = 0)
#计算pij
pij = data1/yij
test = pij*np.log(pij)
test = n