数据包络分析(DEA)笔记

数据包络分析(DEA)是一种运筹学方法,用于评估多投入多产出决策单元的效率。决策单元有投入和产出,效率前沿用于确定最优效率。DEA包括CCR和BCC模型,分别处理固定和变动规模报酬情况。MATLAB中的linprog函数可用于求解权重。文章探讨了DEA在效率评价中的应用及其局限性。
摘要由CSDN通过智能技术生成

        摘自百度百科:数据包络分析(Data envelopment analysis,DEA)是运筹学和研究经济生产边界的一种方法。该方法一般被用来测量一些决策部门的生产效率

数据包络分析是一种对具有相同类型的多投入多产出决策进行绩效评价的方法,每一种多投入多产出的决策称为一个决策单元。

1.决策单元  (Decision Making Units, DMU)

        决策单元是指可以将一定的输入转化为相应的产出的运营实体,并且每一个决策单元都有m种输入和s种输出,用X表示第j个决策单元的投入,用Y表示第j个决策单元的产出,其投入-产出可能集满足凸性、无效性、锥性、最小性四个公理。

        对决策单元的理解:用效率(用)评估其好坏,产出越大越好,投入越节省越好

        只有同类型的决策单元才可以相互比较,省级和市级无法比较,第一产业与二三产业无法比较,决策单元之间的比较是相对的。

2.效率前沿(Efficient Frontier

来看一个单投入多产出的图:

        图中决策单元有两个指标,有些点指标1大而指标2小,我们无法明确决策出最优指标,我们构造一个效率前沿,表示效率前沿上我们的投入在多产出中的相对效率是最大的。

类似这样的一个线(好丑的图):

         横纵坐标是学习时看到的某个例子,但是我觉得作为一个单投入的模型,对一个店来说大部分情况都是销售额越大越好才对,也就是关注x轴就行了。服务顾客数这种赚店面口碑的数据仿佛就代入了时间序列的考究,与数据包络分析关联性是不大的,个人理解不应该拿来和销售额/员工数放一块抢权重。


 再看一个两投入单产出的图:

 

 这里面x1、x2是工人和时间,产出y是产品,单位产品花费时间和花费工人数肯定是越小越好,这样又得到一种效率前沿面:

 这就引申出了CCR模型和BCC模型

       此外,DMU的个数一定要满足条件:

         你的决策单元放少了会导致在你的效率前沿上的点的数量占总数比非常大。


        数据包络分析所适应的场景十分局限,但它正好能够十分契合一个在做课题是与队友讨论了很长时间的点(影响因素分析)。

个人认为MATLAB代码的实现比python代码的实现简单一些,确定决策单元效率评价指数

         u、v分别是产出组合和投入组合的权重系数。选择合适的u、v,目的是将效率评价指数收束在0~1之间。原本认为选择u、v会是个很麻烦的步骤,但是实际上u、v的选择不用自己求,有点像是在做归一化(因为是线性规划问题),它虽然叫权重,但并不影响投入产出组合的效率前沿线的划分,即效率前沿线上存在哪些决策单元。

        不用自己选择权重看起来很神奇,可以直接用MATLAB中的linprog函数完成此步骤

  • CCR模型

CCR模型假设DMU处于固定规模报酬情形下,用来衡量总效率,是一种得到单个决策单元最优效率下的各个输出量与输入量的最佳权重的模型。

        固定规模报酬是经济学术语,指在其他条件不变的情况下,企业内部各种生产要素按相同比例变化时所带来的产量变化。

给出约束条件形成线性规划问题:

其中p、q分别是投入指标个数和产出指标个数。

  • BCC模型

BCC模型假设DMU处于变动规模报酬情形下,比较多产出组合的达成情况,用来衡量纯技术和规模效率,研究多投入情形下的资源配置,在CCR模型基础上改进即可。

 

尚在学习,望不吝指教。

一、软件的具体操作 1.建一个文件夹,里面必须有四个文件(Dblank;deap;deap.000;123.dta)前三个文件在一般下载的DEAP Version 2.1都有,直接复制过来就可以,第四个文件是一个数据文件,一般先在excel先输入,再复制到一个记事本下就可以,注意在记事本下的数据只有数据,不包括决策单元的名称和投入、产出的名称,并且一定要先放产出,后是投入。例子具体见123电子表格和123记事本。 2.对命令Dblank文件进行修改,修改后保存为123.ins文件 3.打开deap软件,运行123.ins 4,回车后自动会有123.out 注意事项:(1) 123.dta;Dblank;123.ins都用记事本打开; (2)数据文件名和命令文件名一定要一样,如例子都用123 (3)文件夹一定要包括deap.000文件,如果没有这个文件,打开deap软件,就会出现一闪就没有了的情况。 二,结果的分析 在文件夹打开123.out,看如下: 1) firm crste vrste scale 1 0.687 1.000 0.687 drs 2 0.814 1.000 0.814 drs 3 0.319 0.709 0.450 drs 4 1.000 1.000 1.000 - 5 1.000 1.000 1.000 - 6 0.336 0.425 0.791 drs 7 0.642 0.648 0.991 irs 8 0.379 0.381 0.994 irs 9 0.702 0.750 0.936 irs 10 1.000 1.000 1.000 - 11 0.304 0.461 0.659 irs 12 0.352 1.000 0.352 irs 13 1.000 1.000 1.000 - 14 0.594 0.929 0.639 irs 15 0.402 1.000 0.402 irs mean 0.635 0.820 0.781 firm:代表例子的15的样本 crste:技术效率,也叫综合效率 vrste:纯技术效率 scale:规模效率(drs:规模报酬递减;-:规模报酬不变;irs:规模报酬递增) crste=vrste×scale 2) Results for firm: 3 Technical efficiency = 0.709 Scale efficiency = 0.450 (drs) PROJECTION SUMMARY: variable original radial slack projected value movement movement value output 1 7326.380 0.000 0.000 7326.380 output 2 119.910 0.000 0.000 119.910 input 1 15427.000 -4496.010 0.000 10930.990 input 2 5257.970 -1532.371 -1643.828 2081.771 第三个样本的具体分析如下: 纯技术效率=0.709 规模效率=0.450 (drs):规模报酬应该递减 第三个样本的投入产出情况分析: 第一、二产出均没有冗余情况(因为其 radial movement 和 slack movement 均为零) 第一个投入要素有投入冗余4496.010;第二投入要素有投入冗余3176.199=1532.371+1643.828 这个意思是说按第三个样本现在的产出冗余第一个投入要素可以减少4496.010,第二个投入要素可以减少3176.199 Results for firm: 8 Technical efficiency = 0.381 Scale efficiency = 0.994 (irs) PROJECTION SUMMARY: variable original radial slack projected value movement movement value output 1 235.860 0.000 0.000 235.860 output 2 3.760 0.000 6.995 10.755 input 1 777.000 -480.651 0.000 296.349 input 2 132.550 -81.995 0.000 50.555 第八个样本则出现了产出不足的情况,即第二个产出应该比现在增加 6.995 如果投入因素是决策单元可的决定的,而产出因素是不能决定的时,我们分析就可以考虑投入是否能减少,不管产出是否能增加(因为产出是决策单元不可控的因素) 如果产出因素是决策单元可的决定的,而投入因素是不能决定的时,我们分析就可以考虑产出是否能增加,不管投入是否能减少(因为投入是决策单元不可控的因素) 如果样本单元的纯技术效率为1,而规模效率小于1时,这说明样本单元本身的技术效率而言没有投入需要减少、没有产出需要增加;样本单元的综合效率没有达到有效(即1),是因为其规模和投入、产出不相匹配,需要增加规模或减少规模。如例子的第二个样本单元,其规模应该缩小。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值