1 基本概念
数据包络分析(data envelopment analysis,简称DEA)是运筹学、管理科学与数理经济学交叉研究的一个新领域。其是根据多项投入指标和多项产出指标,利用线性规划的方法,对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法。
DEA是以相对效率概念为基础,以凸分析和线性规划为工具,将评价决策单元的指标分成“输入类”指标和“输出类”指标,通过计算各单元的输入与输出之比,评价其决策单元相对有效性的多目标分析评价方法。
DEA的基本思路是在保持决策单元间输入或输出不变的情况下,通过输入和输出数据和数据规划模型确定相对有效的生产前沿面,即Pareto最优解构成的面。
随后将决策单元投影到该生产前沿面上,对比分析各决策单元和生产前沿面的距离来判定相对效率,同时通过投影值来确定非有效决策单元的改进程度。
比如 确定相对优势的产业
建模过程
2 DEA基本模型
2.1 CCR模型
基本原理:设有 n n n 个决策单元,每个决策单元均有 m m m 个输入指标和 k k k 个输出指标,记第 j j j 个决策单元的第 i i i 个输入指标为 x i x_i xi ,第 j j j 个决策单元的第 k k k 个输出指标为 y k y_k yk, v i v_i vi 为第 i i i 个输入指标的权重, u i u_i ui 为第 i i i 个输出指标的权重,且 x i > 0 x_i>0 xi>0, y k > 0 y_k>0 yk>0, v i , u i ≥ 0 v_i\text{,}u_i\ge 0 vi,ui≥0,初始数据见表
x i j x_{ij} xij 和 y i k y_{ik} yik 是向量
x j = [ x 1 j x 2 ⋮ x m j ] , y j = [ y 1 j y 2 j ⋮ y k j ] x_j=\left[ \begin{array}{c} x_{1j}\\ x_2\\ \vdots\\ x_{mj}\\ \end{array} \right] \text{,}y_j=\left[ \begin{array}{c} y_{1j}\\ y_{2j}\\ \vdots\\ y_{kj}\\ \end{array} \right] xj=⎣⎢⎢⎢⎡x1jx2⋮xmj⎦⎥⎥⎥⎤,yj=⎣⎢⎢⎢⎡y1jy2j⋮ykj⎦⎥⎥⎥⎤
中的分量,可以根据历史资料、统计数据和预测计算得到。设输入指标和输出指标的权数向量分别为
V = [ v 1 v 2 ⋮ v m ] , U = [ u 1 u 2 ⋮ u k ] V=\left[ \begin{array}{c} v_1\\ v_2\\ \vdots\\ v_m\\ \end{array} \right] \text{,}U=\left[ \begin{array}{c} u_1\\ u_2\\ \vdots\\ u_k\\ \end{array} \right] V=⎣⎢⎢⎢⎡v1v2⋮vm⎦⎥⎥⎥⎤,U=⎣⎢⎢⎢⎡u1u2⋮uk⎦⎥⎥⎥⎤
如下
矩阵形式
[
v
1
v
2
⋮
v
m
]
[
x
11
x
12
⋯
x
1
n
x
21
x
22
⋯
x
2
n
⋮
⋮
⋮
x
m
1
x
m
2
⋯
x
m
n
]
⇒
[
u
1
u
2
⋮
u
k
]
[
y
11
y
12
⋯
y
1
n
y
21
y
22
⋯
y
2
n
⋮
⋮
⋮
y
k
1
y
k
2
⋯
y
k
n
]
\left[ \begin{array}{c} v_1\\ v_2\\ \vdots\\ v_m\\ \end{array} \right] \left[ \begin{matrix} x_{11}& x_{12}& \cdots& x_{1n}\\ x_{21}& x_{22}& \cdots& x_{2n}\\ \vdots& \vdots& & \vdots\\ x_{m1}& x_{m2}& \cdots& x_{mn}\\ \end{matrix} \right] \Rightarrow \left[ \begin{array}{c} u_1\\ u_2\\ \vdots\\ u_k\\ \end{array} \right] \left[ \begin{matrix} y_{11}& y_{12}& \cdots& y_{1n}\\ y_{21}& y_{22}& \cdots& y_{2n}\\ \vdots& \vdots& & \vdots\\ y_{k1}& y_{k2}& \cdots& y_{kn}\\ \end{matrix} \right]
⎣⎢⎢⎢⎡v1v2⋮vm⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡x11x21⋮xm1x12x22⋮xm2⋯⋯⋯x1nx2n⋮xmn⎦⎥⎥⎥⎤⇒⎣⎢⎢⎢⎡u1u2⋮uk⎦⎥⎥⎥⎤⎣⎢⎢⎢⎡y11y21⋮yk1y12y22⋮yk2⋯⋯⋯y1ny2n⋮ykn⎦⎥⎥⎥⎤
设
∑
i
=
1
m
v
i
x
i
j
,
(
j
=
1
,
2
,
⋯
,
n
)
\sum_{i=1}^m{v_ix_{ij}}\ \ \text{,}\left( j=1,2,\cdots ,n \right)
i=1∑mvixij ,(j=1,2,⋯,n)为第
j
j
j 单元输入的综合评价指标;
∑
i
=
1
k
u
i
y
i
j
,
(
j
=
1
,
2
,
⋯
,
n
)
\sum_{i=1}^k{u_iy_{ij}}\ \ \text{,}\left( j=1,2,\cdots ,n \right)
i=1∑kuiyij ,(j=1,2,⋯,n)
为第 j j j 单元输出的综合评价指标;
则每个决策单元 D M U i DMU_i DMUi ,都有相应的效率评价指标
h j = ∑ i = 1 k u i y i j ∑ i = 1 m v i x i j h_j=\frac{\sum_{i=1}^k{u_iy_{ij}}}{\sum_{i=1}^m{v_ix_{ij}}} hj=∑i=1mvixij∑i=1kuiyij
由此定义有:
(1)总可以适当的选取
u
,
v
u,v
u,v,使
h
j
≤
1
h_j\le 1
hj≤1 ;
(2)粗略的说,对于决策单元
D
M
U
j
0
DMU_{j0}
DMUj0 ,
h
j
0
h_{j0}
hj0 越大表明,
D
M
U
j
0
DMU_{j0}
DMUj0 能够用相对较少的输入得到相对较多的输出。
要评价第 j 0 j_0 j0 个评价单元相对有效性,需建立评价系统的CCR模型。
设第 j 0 j_0 j0 个评价单元的投入向量和产出向量分别为 x 0 = ( x 1 j 0 , x 2 j 0 , ⋯ , x m j 0 ) T x_0=\left( x_{1j0},x_{2j0},\cdots ,x_{mj0} \right) ^T x0=(x1j0,x2j0,⋯,xmj0)T和 y 0 = ( y 1 j 0 , y 2 j 0 , ⋯ , y k j 0 ) T y_0=\left( y_{1j0},y_{2j0},\cdots ,y_{kj0} \right) ^T y0=(y1j0,y2j0,⋯,ykj0)T
效率指标 h o = h j 0 h_o=h_{j0} ho=hj0
在效率评价指标 h j ≤ 1 ( j = 1 , 2 , ⋯ , n ) h_j\le 1\ \left( j=1,2,\cdots ,n \right) hj≤1 (j=1,2,⋯,n) 的约束条件下,选择一组最优权系数 u , v u,v u,v 使 h 0 h_0 h0 达到最大值。构造最优化模型:
max h 0 = ∑ r = 1 k u r y r j 0 ∑ i = 1 m v i x i j 0 \max\text{\ }h_0=\frac{\sum_{r=1}^k{u_ry_{rj_0}}}{\sum_{i=1}^m{v_ix_{ij_0}}} max h0=∑i=1mvixij0∑r=1kuryrj0 s . t . = { ∑ r = 1 k u r y r j / ∑ i = 1 m v i x i j ≤ 1 ( j = 1 , 2 , ⋯ , n ) v i ≥ 0 ( i = 1 , 2 , ⋯ , m ) u r ≥ 0 ( r = 1 , 2 , ⋯ , k ) s.t.=\left\{ \begin{array}{l} \sum_{r=1}^k{u_ry_{rj}}/\sum_{i=1}^m{v_ix_{ij}}\le 1\,\,\left( j=1,2,\cdots ,n \right)\\ \\ v_i\ge 0\,\,\left( i=1,2,\cdots ,m \right)\\ \\ u_r\ge 0\,\,\left( r=1,2,\cdots ,k \right)\\ \end{array} \right. s.t.=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧∑r=1kuryrj/∑i=1mvixij≤1(j=1,2,⋯,n)vi≥0(i=1,2,⋯,m)ur≥0(r=1,2,⋯,k)
矩阵形式
max h 0 \max\text{\ }h_0 max h0 s . t . = { h j = U T y j V T x j ≤ 1 ( j = 1 , 2 , ⋯ , n ) V ≥ 0 U ≥ 0 s.t.=\left\{ \begin{array}{l} h_j=\frac{U^Ty_j}{V^Tx_j}\le 1\ \left( j=1,2,\cdots ,n \right)\\ V\ge 0\\ U\ge 0\\ \end{array} \right. s.t.=⎩⎪⎨⎪⎧hj=VTxjUTyj≤1 (j=1,2,⋯,n)V≥0U≥0
将上述分式规划转化为等价的线性规划方程组。采用Charnes-Cooper变换,令:
t = 1 V T x 0 > 0 , ω = t v , μ = t u t=\frac{1}{V^Tx_0}>0\text{,}\omega =tv\text{,}\mu =tu t=VTx01>0,ω=tv,μ=tu
{ max μ T y 0 = h 0 ω T x j − μ T y j ≥ 0 , j = 1 , 2 , ⋯ , n ; ω T x 0 = 1 ; ω ≥ 0 , μ ≥ 0 \left\{ \begin{array}{l} \max\text{\ }\mu ^Ty_0=h_0\\ \\ \ \ \omega ^Tx_j-\mu ^Ty_j\ge 0\text{,}j=1,2,\cdots ,n;\\ \\ \ \ \omega ^Tx_0=1;\\ \\ \ \ \omega \ge 0\text{,}\mu \ge 0\\ \end{array} \right. ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧max μTy0=h0 ωTxj−μTyj≥0,j=1,2,⋯,n; ωTx0=1; ω≥0,μ≥0
- DEA有效:最优日标值 h 0 = 1 h_0 = 1 h0=1
- DEA有效:若存在最优解 ω 0 , μ 0 \omega ^0,\mu ^0 ω0,μ0 满足 ω 0 > 0 , μ 0 > 0 , h 0 = μ 0 y 0 = 1 \omega ^0>0\text{,}\mu ^0>0\text{,}h_0=\mu ^0y_0=1 ω0>0,μ0>0,h0=μ0y0=1
2.1 BCC模型
参考:研发投入产出效率的国际比较研究—基于三阶段DEA模型分析
3 DEA有效的经济意义
-
数据包络分析DEA的本质是利用统计数据确定相对有效的生产前沿面,利用生产前沿面的理论和方法,建立非参数的最优化模型,研究相同类型部门间的效率差异。
-
根据DEA的原理,DEA有效的DMU在每个投入指标和每个产出指标乘以一个加权系数后,其产出加权和投入加权和之比是最大的,因为所有的其他DMU用样的加权系数算出这一比值都不会超过1。
实际上,可以把这样的投入产出关系认为是生产函数上的一个点,由不同规模上DEA有效的投入产出关系就能得到完整的生产函数。
处于包络线(或生产前沿生产面)上的决策单元称为DEA有效(或Pareto有效)
如果是多投入指标和多产出指标,DEA有效的所有决策单元不能落到一条曲线上,而是形成一个超平面,它是生产函数的扩展,
用距离函数测量生产单位与生产前沿面的距离,既可以沿着产出增加方向也可以沿着投入减少方向进行效率改善。有效的决策单元决定了生产可能集的前沿面
例如 A 点的效率值为:
θ
A
=
O
Q
O
A
<
1
\theta _A=\frac{OQ}{OA}<1
θA=OAOQ<1
D点的效率值为:
θ
D
=
O
D
O
D
=
1
\theta _D=\frac{OD}{OD}=1
θD=ODOD=1
DEA效率值的经济意义:
技术效率值(TE)TE可分解得到纯技术效率值(PTE)和规模效率值(SE,SE=TE/PTE)。
三者的经济意义分别为:TE是对决策单元综合效率的衡量;PTE是对决策单元配置资源效率的衡量;SE是对决策单元投入资源规模效率的衡量。
4 AHP与DEA的结合
AHP法的判断矩阵是有评价者或专家给定的,因此其一致性必然受到有关人员的知识结构、判断水平及个人偏好等诸多主观因素的影响。
DEA各决策单元的输入输出数据指标的权重为变量,使各指标的权重不受主观因素的影响。
结合二者的权重可以得到加权综合权重
两者结合避免了仅仅采用DEA方法会导致的指标选取的人为性和随意性.
参考:
https://wenku.baidu.com/view/9deab6341711cc7930b7164c.html?fr=search-1
https://www.51wendang.com/doc/3c307949db456a02f69aec96/2