【指数编制系列三】权重设置方法

最新推荐文章于 2023-02-24 18:47:21 发布

kewilling

最新推荐文章于 2023-02-24 18:47:21 发布

阅读量1.2w

点赞数 6

分类专栏：指数系列文章标签：指数

本文链接：https://blog.csdn.net/weixin_43285343/article/details/103157250

版权

指数系列专栏收录该内容

11 篇文章

订阅专栏

在指数编制方法中，我们会经常提到加权平均法（这个在后面会介绍），这里面有一个重要的概念就是权重。权重的设定在指数编制过程中是非常重要的一步，适当的权重设定是指数客观准确反映目标变化趋势的一个关键要素。所以在设定权重的时候一定要选择合适的方法。

权重是一个相对的概念，是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。权重表示在评价过程中，是被评价对象的不同侧面的重要程度的定量分配，对各评价因子在总体评价中的作用进行区别对待。事实上，没有重点的评价就不算是客观的评价。

在统计理论和实践中，权重是表明各个评价指标（或者评价项目）重要性的权数，表示各个评价指标在总体中所起的不同作用。权重有不同的种类，各种类别的权重有着不同的数学特点和经济含义，一般有以下几种权重。

按照权重的表现形式的不同，可分为绝对数权重和相对数权重。相对数权重也称比重权数，能更加直观地反映权重在评价中的作用。

按照权重的形成方式划分，可分为人工权重和自然权重。自然权重是由于变换统计资料的表现形式和统计指标的合成方式而得到的权重，也称为客观权重。人工权重是根据研究目的和评价指标的内涵状况，主观地分析、判断来确定的反映各个指标重要程度的权数，也称为主观权重。

按照权重形成的数量特点的不同划分，可分为定性赋权和定量赋权。如果在统计综合评价时，采取定性赋权和定量赋权的方法相结合，获得的效果更好。

确定权重的方法有多种，下面按照主观赋权和客观赋权的方法进行分类介绍。

一.主观赋权方法

排序编码法
这种方法通过管理者对各项考评因素的重视程度进行排序编码，然后确定权重的一种简单的方法，需要管理者从过去的历史数据及个人的经验对各项考评项目作出正确的排序。
比如在绩效考核过程中，某一职位有四个KPI的考评因素，分别为A，B，C，D，依企业的要求及目标设定者的经验，各项考评因素的重要性排序为 B，D，C，A；然后再按照自然数顺序由大到小对其进行分配，分别为4，3，2，1。然后将权数归一化，最后结果为 A：1/(4+3+2+1)=0.1；B：4/(4+3+2+1)=0.4 C：2/(4+3+2+1)=0.2；D：3/(4+3+2+1)=0.3。
这种简单排序编码法计算权数的方法简单，但也存在主观因素，存在一定的不合理性。但至少它比管理者单纯地依据自身经验进行设定的方式要客观一些。
倍数环比法
倍数环比法首先将各个考评因素随机排列，然后按照顺序对各项因素进行比较，得出各因素重要度之间的倍数关系，又称环比比率，再将环比比率进行统一转换为基准值，最后进行归一化处理，确定其终权重。这种方法需要对考评因素有客观的判断依据，需要有客观准确的历史数据作为支撑。
以上述四个因素为例，如下表。

说明:表格第二行，0.3表示A的重要性是B的0.3倍；2表示B的要性是C的2倍，0.55表示C的重要性是D的0.55倍；1表示D本身。第三行，是以D为基准进行的比率归一化，因C的重要性是D的0.55倍，因此取值为0.551=0.55；B是C的2倍，所以取值为 0.552=1.1；以下类推。最终权重则以合计数为分母，各基准值为分子算出。
这种倍数环比法决定权重的方法较为实用，计算也简单，由于有准确的历史数据作支撑，因此具有较高的客观科学性。
德尔菲法
德尔菲(Delphi)法是美国兰德公司于1964 年发明并首先将其应用于预测分析的，是以古希腊城市德尔菲命名的规定程序专家评估方法。
德尔菲法是一种群体决策行为，具有匿名性、反馈性和统计性的特点，本质上是建立在众多专家的专业知识、经验和主观判断能力基础上的，因此，特别适用于缺少信息资料和历史数据，而又较多地受到其他因素影响的信息分析与预测。德尔菲法通过一个多次与专家交互的循环过程，使分散的意见逐次收敛在协调一致的结果上，充分发挥了信息反馈和信息控制的作用。
德尔菲法的流程为：
(1)明确评估目标
明确进行效能评估的目标，借助人的逻辑思维和经验能对目标的评价收到很好的效果。
(2)选聘专家
专家的权威程度要高，有独到的见解，有丰富的经验和较高的理论水平，这样才能提供正确的意见和有价值的判断。这是很重要的一步，选得好不好将直接影响到结果的准确性。一般情况下，选本专业领域中既有实际工作经验又有较深理论修养的专家10～30人左右，并需征得专家本人的同意。
(3)发布问题
发布需要专家评估的问题，将待定权重的p个指标和有关资料以及统一的确定权重的规则发给选定的各位专家，请他们独立的给出各指标的权数值。
(4)专家对问题进行评估
专家采用匿名或“背靠背”的形式进行评估，专家根据评估规则回答问题，并说明回答问题的依据，按照该程序完成对所有问题的回答。传统德尔菲法的调查程序，一般为4 轮。系统将第1 轮的调查结果生成报表或文档，调查结果包括每位专家对问题的回答以及回答问题的依据，将调查结果分发给每位专家，在此基础上再进行第2 轮的调查，调查方法与第1 轮相似，再完成第3 轮和第4 轮的调查。
(5)对获取的专家知识进行处理
以专家的原始意见为基础，建立专家意见集成的优化模型，综合考虑一致性和协调性因素，同时满足整体意见收敛性的要求，找到群体决策的最优解或满意解，获得具有可信度指标的结论，达到专家意见集成的目的。直至各指标权数与其均值的离差不超过预先给定的标准为止，也就是各专家的意见基本趋于一致，以此时各指标权数的均值作为该指标的权重。
层次分析法
层次分析法（Analytic Hierarchy Process）简称AHP，是美国运筹学家T. L. Saaty教授于70年代初期提出的， AHP是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法。它的特点是把复杂问题中的各种因素通过划分为相互联系的有序层次，使之条理化，根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来，将每个层次元素两两比较的重要性进行定量描述。而后，利用数学方法计算反映每一层次元素的相对重要性次序的权值，通过所有层次之间的总排序计算所有元素的相对权重并进行排序。

层次分析法的基本步骤：

1、建立层次结构模型。在深入分析实际问题的基础上，将有关的各个因素按照不同属性自上而下地分解成若干层次，同一层的诸因素从属于上一层的因素或对上层因素有影响，同时又支配下一层的因素或受到下层因素的作用。最上层为目标层，通常只有1个因素，最下层通常为方案或对象层，中间可以有一个或几个层次，通常为准则或指标层。当准则过多时(譬如多于9个)应进一步分解出子准则层。
2、构造成对比较阵。从层次结构模型的第2层开始，对于从属于(或影响)上一层每个因素的同一层诸因素，用成对比较法和1—9比较尺度构造成对比较阵，直到最下层。　　
3、计算权向量并做一致性检验。对于每一个成对比较阵计算最大特征根及对应特征向量，利用一致性指标、随机一致性指标和一致性比率做一致性检验。若检验通过，特征向量(归一化后)即为权向量：若不通过，需重新构造成对比较阵。　　
4、计算组合权向量并做组合一致性检验。计算最下层对目标的组合权向量，并根据公式做组合一致性检验，若检验通过，则可按照组合权向量表示的结果进行决策，否则需要重新考虑模型或重新构造那些一致性比率较大的成对比较阵。

在应用层次分析法时，必须满足以下几个前提：

1.各层的要素必须是已知的，并且条理结构清晰，能够按层次区分排列；2.同一层中的各要素的关系是平等的，而各要素间相互独立，不存在显著的相关性；3.最底层的指标可以被量化，并能够通过一定的方法测量；4.需要明确各层次间要素的影响关系。

层次分析法在指数编制中是较为常用的一种方法，这种虽然说打分过程是主观判断的，但是整个计算过程相对科学和完整，具有较强的应用性。因为打分过程是个相对比较的过程，能够较好的避免主观误差。下面直接贴一个代码，大家可以直接用，只需将代码中的打分矩阵替换一下就可以用。

# -*- coding: utf-8 -*-
#a,b,c,d,f为二级指标的打分矩阵，e为一级指标的打分矩阵，根据需要进行更换使用。

import numpy as np

RI_dict = {1: 0, 2: 0, 3: 0.58, 4: 0.90, 5: 1.12, 6: 1.24, 7: 1.32, 8: 1.41, 9: 1.45}


def get_w(array):
    row = array.shape[0]  # 计算出阶数
    a_axis_0_sum = array.sum(axis=0)
    # print(a_axis_0_sum)
    b = array / a_axis_0_sum  # 新的矩阵b
    # print(b)
    b_axis_0_sum = b.sum(axis=0)
    b_axis_1_sum = b.sum(axis=1)  # 每一行的特征向量
    # print(b_axis_1_sum)
    w = b_axis_1_sum / row  # 归一化处理(特征向量)
    nw = w * row
    AW = (w * array).sum(axis=1)
    # print(AW)
    max_max = sum(AW / (row * w))
    # print(max_max)
    CI = (max_max - row) / (row - 1)
    CR = CI / RI_dict[row]
    if CR < 0.1:
        # print(round(CR, 3))
        # print('满足一致性')
        # print(np.max(w))
        # print(sorted(w,reverse=True))
        # print(max_max)
        # print('特征向量:%s' % w)
        return w
    else:
        print(round(CR, 3))
        print('不满足一致性，请进行修改')


def main(array):
    if type(array) is np.ndarray:
        return get_w(array)
    else:
        print('请输入numpy对象')


if __name__ == '__main__':
    # 打分矩阵
    e = np.array([[1, 2, 7, 5, 5], [1 / 2, 1, 4, 3, 3], [1 / 7, 1 / 4, 1, 1 / 2, 1 / 3], [1 / 5, 1 / 3, 2, 1, 1], [1 / 5, 1 / 3, 3, 1, 1]])
    a = np.array([[1, 1 / 3, 1 / 8], [3, 1, 1 / 3], [8, 3, 1]])
    b = np.array([[1, 2, 5], [1 / 2, 1, 2], [1 / 5, 1 / 2, 1]])
    c = np.array([[1, 1, 3], [1, 1, 3], [1 / 3, 1 / 3, 1]])
    d = np.array([[1, 3, 4], [1 / 3, 1, 1], [1 / 4, 1, 1]])
    f = np.array([[1, 4, 1 / 2], [1 / 4, 1, 1 / 4], [2, 4, 1]])
    e = main(e)
    a = main(a)
    b = main(b)
    c = main(c)
    d = main(d)
    f = main(f)
    try:
        res = np.array([a, b, c, d, f])
        ret = (np.transpose(res) * e).sum(axis=0)
        print(ret)
    except TypeError:
        print('数据有误，可能不满足一致性，请进行修改')

二.客观赋权方法

熵值法
熵( Entropy) 原是统计物理和热力学中的一个物理概念，后来熵的概念逐渐衍化为三种: 热力学熵、统计熵和信息熵。文中用到的是信息熵。在信息论中，信息熵用来度量系统无序度。某一指标的信息熵越大，系统无序度越高，指标值的变异程度越小，指标在评价中的效用值越小，则熵权也越小; 反之，指标信息熵越小，指标的变异程度越大，其效用值越大，熵权也越大。熵值法( Entropy Method) 就是根据信息熵的原理，利用各指标值所提供的信息量的大小，以此确定指标权重的方法，属于客观赋权法。
根据熵的概念和原理，熵值法求权重并进行综合评价的基本步骤如下:
1）原始数据及标准化处理。
设有对象m 个，指标n个， $x_{ij}$ 为第i 个对象第j 个评价指标的数值，于是得到评价系统的初始数据矩阵X:
$X=(x_{ij})_{m*n} ({i=1,2,{\cdots}, m};{j=1,2,{\cdots}, n})$
在综合评价中，指标的性质和量纲往往不同，为了消除不可公度性，需对初始数据做标准化处理，形成标准化矩阵X’
$X^{'}=(x_{ij}^{'})_{m*n}$

计算第j 个指标第i 个对象在所有对象中所占的比重 $p_{ij}$ :
$p_{ij}=\frac{x_{ij}^{'}}{\sum_{i=1}^m x_{ij}^{'}}$
计算信息熵h 和信息效用值g。第j 个指标的信息熵值 $h_j$ 为:
$h_{j}=-k{\sum_{i=1}^m p_{ij}lnp_{ij}}$
其中，
$k=\frac{1}{lnm},({j=1,2,{\cdots}, n};0≤h≤1)$
因信息熵 $h_j$ 可以衡量第j 个指标信息的效用值，当信息完全无序时，即 $h_j$ = 1，此时 $h_j$ 指标对综合评价不起作用，指标效用值为0。故某指标效用值可用信息熵 $h_j$ 与1之间的差值 $g_j$ 表示，即第j 项指标效用值 $g_j$ 为:
$g_{j}=1-h_{j}$
计算第j 个指标的权重，即熵权 $ω_j$ 为:
$w_{j}=\frac{g_{j}}{\sum_{j=1}^n g_{j}}$
综合评价。用第j 个指标的权重 $ω_j$ 和标准化矩阵中第i 个评价对象第j 个指标数值的乘积作为 $x_{ij}$ 的评价值 $f_{ij}$ :
$f_{ij}=w_{j}x_{ij}^{'}$
则第i 个对象的评价值 $f_i$ 为:
$f_{i}={\sum_{j=1}^n f_{ij}}$
评价对象的 $f_i$ 越大，对象越优，比较所有 $f_i$ 数值，就可得到最佳评价对象。
一般认为, 熵值法能够深刻地反映出指标信息熵值的效用价值, 其给出的指标权重值比得尔菲法和层次分析法有较高的可信度, 但它缺乏各指标之间的横向比较, 又需要完整的样本数据, 在应用上受到限制。

critic法
CRITIC 法是Diakoulaki（1995）提出的一种客观赋权方法。其基本思想是基于评价指标间的辨别力和冲突性来确立指标的客观权数。首先，指标的辨别力是指同一指标针对不同样本取值的差异性大小，评价指标在不同样本中取值的差异性越大，说明其辨别力越强；相反，评价指标在不同样本中取值的差异性越小，说明其辨别力越弱。一般用标准差来度量指标的辨别力的大小；其次，指标的冲突性是指各指标之间的相关性大小，一般运用相关系数来度量冲突性的大小和方向。为度量某指标的综合冲突性大小，可以通过计算∑（1- $r_{ij}$ ）的值来度量某指标与其它指标间的冲突性，其中 $r_{ij}$ 是第i 个评价指标与第j 个评价指标的相关系数。综上，运用指标间的辨别力和冲突性来综合度量各指标的权重，这就是CRITIC 法赋权的基本思想。令各指标所含信息量为C，则第j 个评价指标所代表的信息综合信息量可用 $C_j$ 可表示，具体计算公式如式
$C_{j}=\sigma_j{\sum_{i=1}^n(1-r_{ij})},{j=1,2,{\cdots}, n}$
将上式中的 $C_j$ 进行归一化处理即可得到第j 个指标的客观权重，习惯用 $W_j$ 表示。 $C_j$ 越大，则表示某指标所包含的信息量较多，因而该评价指标比其他指标的权重更大。
$w_{j}=\frac{C_{j}}{\sum_{j=1}^n C_{j}}$
主成分分析法
主成分分析能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。
主成分分析,首先是由英国的皮尔生对非随机变量引入的,而后美国的数理统计学家赫特林在1933年将此方法推广到随机向量的情形。主成分分析的降维思想从一开始就很好地为综合评价提供了有力的理论和技术支持。
主成分分析是研究如何将多指标问题转化为较少的综合指标的一种重要统计方法,它能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。
主成分分析除了降低多变量数据系统的维度以外,同时还简化了变量系统的统计数字特征。主成分分析在对多变量数据系统进行最佳简化的同时,还可以提供许多重要的系统信息,例如数据点的重心位置(或称为平均水平),数据变异的最大方向,群点的散布范围等。
主成分分析的基本思路可概述如下:借助一个正交变换,将分量相关的原随机变量转换成分量不相关的新变量,从代数角度,即将原变量的协方差阵转换成对角阵,从几何角度,将原变量系统变换成新的正交系统,使之指向样本点散布最开的正交方向,进而对多维变量系统进行降维处理。按照特征提取的观点,主成分分析相当于一种基于最小均方误差的提取方法。
主成分确定权重的步骤：
设有ｐ个专家对ｎ个评价对象进行打分评价，得到一个ｎ×ｐ矩阵Ｘ，矩阵Ｘ的第ｉ列向量为 $x_i$ ，通过计算ｐ个 $x_1,x_2,⋯x_p)$ 向量间的相关系数矩阵，求出该矩阵特征值及其特征向量，根据特征值确定主成分个数、特征向量确定主成分，最后根据方差贡献率确定每个专家的权重。

第一步，计算随机变量 $x_1,x_2,⋯x_p$ 的相关系数矩阵为 $M_{(p×p)}$ ；

第二步，求矩阵 $M_{(p×p)}$ 的特征值从大到小排列为 $λ_1,λ_2,⋯λ_p$ ；对应的特征向量分别为 $ξ_1=[(a_{11},a_{12},⋯a_{1p})]^T$ ， $ξ_2=[(a_{21},a_{22},⋯a_{2p})]^T$ ，…， $ξ_p=[(a_{p1},a_{p2},⋯a_{pp})]^T$ ；

第三步，确定方差贡献率并确定主成分的个数m(1≤m≤p)，使得 $(\sum_{(i=1)}^mλ_i )/(\sum_{(i=1)}^pλ_i )≥85\%$ ；

第四步，计算权重，
$WA*(x_1,x_2,⋯x_p )=\sum_{i=1}^mλ_i Z_i =\sum_{i=1}^mλ_i (a_{i1} x_1+a_{i2} x_2+⋯+a_{ip} x_p)=\sum_{i=1}^p(\sum_{j=1}^mλ_j a_{ij})$
由此得到 $x_i$ 的权重为：
$ω_i^*=\sum_{j=1}^mλ_j a_{ij} (1≤i≤p)$

第五步，重新分配权重，使得权重之和为１，根据分配原则，新的权重为：
$ω_i=(\sum_{j=1}^mλ_j a_{ij} )/(\sum_{i=1}^p\sum_{j=1}^mλ_j a_{ij} ) (1≤i≤p)$

三.主观客观结合法

在很多指数编制过程中，为了综合主观赋权和客观赋权的优势，通常会采用主观赋权结合客观赋权的方法。这种方法的主要思路有两种，一种是分别利用客观赋权法和主观赋权法分别计算出一套权重，然后再按照一定的比例进行综合；另外一种方法是以客观赋权为基础，然后再利用主观赋权方法对客观权重进行调整。这些方法都需要根据指数项目的实际情况而定。

All things are difficult before they are easy.