数据包络分析(DEA)是是由美国著名运筹学家 A.Charnes(查恩斯)、W.W.Cooper(库铂)、E.Rhodes(罗兹)于 1978 年首先提出,在相对效率评价概念基础上发展起来的一种非参数检验方法。此文章主要介绍如何在stata中进行DEA分析以及进行boostrap检验,用到的命令为tenonradial
,teradialbc
等。需要说明的是,尽管此命令的运算速度与矩阵的最大处理量要优于dea
命令,但是其仍有一些限制。
DEA模型简介
技术效率的概念
在数据包络分析中,技术效率是指一个生产单元(DMU)的生产水平达到该行业技术水平的程度。技术效率可以从投入和产出两个角度来衡量,在投入既定的情况下,技术效率由产出最大化的程度来衡量。在产出既定的情况下,技术效率由投入最小化的程度来衡量。当然,在计算TFP的过程中,一般都是投入既定的。
下面举一个一种投入一种产出时的例子,来帮助我们理解技术效率的概念。
单位 | x x x(投入) | y y y(产出) | y / x y/x y/x | y / x y/x y/x(标准化) |
---|---|---|---|---|
A | 2 | 1 | 0.5 | 0.625 |
B | 3 | 2 | 0.667 | 0.533 |
C | 4 | 3 | 0.75 | 0.938 |
D | 5 | 4 | 0.8 | 1.00 |
E | 5 | 2 | 0.4 | 0.5 |
在此表中, y / x y/x y/x反应各个生产单元技术效率的高低, y / x y/x y/x(标准化)是将各单元的 y / x y/x y/x除以其中的最大值。这样就是为了更好的比较这一数值。
当涉及多个产出时,就会对各个投入与产出赋予一定的权重,然后分别加权,计算产出投入比。如:
v = v 1 x 1 + v 2 x 2 + . . . + v n x n v = v_1x_1+v_2x_2+...+v_nx_n v=v1x1+v2x2+...+vnxn
u = u 1 y 1 + u 2 y 2 + . . . + u n y n u=u_1y_1+u_2y_2+...+u_ny_n u=u1y1+u2y2+...+unyn
则产出投入比为 u / v u/v u/v
数据包络分析就是在讨论如何通过数据本身来获得权重,从而计算各个DMU的技术效率。
径向距离模型
此命令径向效率的度量方法采用的是Debreu–Farrell(Debreu 1951; Farrell 1957)方法。假设有 k k k个 D M U DMU DMU。对于 D M U K DMU_K DMUK,有 N N N种投入,记为 x k = ( x k 1 , . . . , x k N ) ∈ R N x_k =(x_{k1},...,x_{kN}) \in R^N xk=(xk1,...,xkN)∈RN