matlab在数据包络分析中的应用_DEA (数据包络分析)介绍及 python3 实现

19bf0738c522fd81fad87f2243fdfb94.png

1 (重复了好几次的)前言

使用比较系统的、规范的方法对于多个指标、多个单位同时进行评价的方法,也叫多指标综合评价方法。

评价方法大体上可分为主观赋权、客观赋权,其主要区别在确定权重的方法上。

  • 主观赋权法: 多数采取综合咨询评分确定权重。如综合指数法、模糊综合评判法、层次分析法、功效系数法等。这些方法都依赖于 “专家” 的权重或较多独立个体的评判偏好。
  • 客观赋权法: 根据各指标间相关关系或各指标值变异程度来确定权数,如主成分分析法、因子分析法、优劣解距离法等。目前国内外综合评价方法有数十种之多,其中主要使用的评价方法有主成分分析法、因子分析法、TOPSIS法、秩和比法、灰色关联法、熵权法、层次分析法、模糊评价法、物元分析法、聚类分析法、价值工程法、神经网络法等。这些方法依赖于数据本身,本质上与数据间的大小、方差有关。

综合评价的方法一般是主客观结合的,方法的选择需基于实际指标数据情况选定,最为关键的是指标的选取,以及指标权重的设置,这些需要基于广泛的调研和扎实的业务知识,不能说单纯的从数学上解决的。

评价指标的选择对于任何综合评价来说评价指标的选择都是至关重要的。选择评价指标的原则主要有:

  • 尽量能够全面反映整个事物,尽量选择代表性强的指标
  • 指标间的相关性尽可能不强,如果指标间具有较强的相关性,会给最后的分析结果带来偏移,应不纳入评价系统。如果选择的指标具有较强的相关性,而实际工作中又不宜将其摒弃,就应该对这些指标加权。指标权系数的确定应该从专业和相关大小等诸方面来考虑。

综合评价的应用领域和范围非常广泛。从学科领域上看,在自然科学中广泛应用于各种事物的特征和性质的评价。比如,环境监测综合评价、药物临床试验综合评价、地质灾害综合评价、气候特征综合评价、产品质量综合评价等等;在社会科学中广泛应用于总体特征和个体特征的综合评价。比如,社会治安综合评价,生活质量综合评价、社会发展综合评价、教学水平综合评价、人居环境综合评价等等。在经济学学科领域更为普遍。如,综合经济效益评价、小康建设进程评价、经济预警评价分析、生产方式综合评价、房地产市场景气程度综合评价等等。

2 之前的工作

原先以及更新过 TOPSIS 和 RSR 的介绍及其代码实现 (近期已做代码优化)

Suranyi:TOPSIS法(优劣解距离法)介绍及 python3 实现​zhuanlan.zhihu.com
0f6ddad1c10a6960e216ac36130f2a79.png
Suranyi:RSR(秩和比综合评价法)介绍及python3实现​zhuanlan.zhihu.com
1d40e06458bbf89fde238e62415db814.png

本文使用的 DEA 分析的代码是使用 Gurobi 作为求解器编写的, 有关 Gurobi 的介绍及简单入门可以参考下文:

Suranyi:gurobi 高效数学规划引擎 | python3 配置、使用及建模实例​zhuanlan.zhihu.com
e52397016fbf3bdf943094e5545f1d4d.png

3 DEA 数据包络分析

(1) 综述

绩效评估是评估组织或个人如何以较少的资源获得较多的产出结果的多属性评估,也称之为成本效益分析。数据包络分析是 A.Charnes, W.W.Copper 和 E.Rhodes 在 1978 年提出的评价多指标输入输出,衡量系统有效性的方法。将属性划分为投入项、产出项(成本型、效益型指标),不预先设定权重,只关心总产出与总投入,以其比率作为相对效率。数据包络分析有多种模式,主要为:CCR 模式,BBC 模式、交叉模式、A&P 模式。

(2) 构建决策单元

在 DEA 中,每个评估的对象称为“决策单元”(记为 DMU),设共有

个决策对象,每个决策单元都有
种投入和
种产出,
表示第
个决策单元的第
项投入,
表示第
个决策单元的第
项产出,
​ 分别表示投入、产出权值向量。

(3) 建立 DEA 效率评估模型 (CCR 模式)

定义: 决策单元

的效益评价指数为:

从投入资源的角度来看,在当前产出的水准下,比较投入资源的使用情况,以此作为效益评价的依据,这种模式称为“投入导向模式”。但这种模型不是传统的线性规划模型, 难以求最优解, 因此将其线性化后, 取对偶模型 (具体推导过程可见参考文献), 转为如下模型:

评价决策单元

效益的 CCR 模式线性规划模型为:

这个模型可以直观地理解为将决策单元
的投入、产出表示为其他决策单元的线性组合.

如果有某个 (或某些) 决策单元的产出量达到决策单元
的水平 (达到, 不一定要超过. 第二个约束的含义), 而投入量尽可能小 (第一个约束的含义), 那么会出现
的情况, 此时说明该决策单元存在资源浪费。

反之, 如果该决策单元的效率已经是最高的了, 那么任何的决策单元都不能使用比它还要少的投入获得同样 (甚至更多) 的产出. 这时候

为加速模型求解及分析产能效应,为上述方程引入松弛变量

​。其中
称为差额变数,表示该决策单元为达到 “DEA 有效” 应减少的投入量,​
称为超额变数,代表为达到 “DEA 有效” 应增加的产出量。引入非阿基米德数 ε (non-Archimedean constant,通常设为
​),CCR 模式线性规划模型化为:

尽管 ε 很小,但我们无法得知各

的大小数量级,直接进行计算可能会产生误差,因此求解该问题使用分层序列法。第一阶段求解
的最小值,第二阶段在
已知下求
的最大值,即:
分层序列法 设多目标决策给出的重要性序列为:
, 首先对第一个目标求最优解, 并找出所有最优解的集合记为
, 然后在
内求第二个目标的最优解, 记这时的最优解集合为
, 如此一直到求出第
个目标的最优解
, 其模型如下:

—— 《运筹学》教材编写组. 运筹学.第4版[M]. 清华大学出版社, 2012.

(4) DEA 分析/模型结果分析

1) 效益分析

  • 综合技术效益(overall efficiency, OE)反映的是决策单元在一定( 最优规模时) 投入要素的生产效率,是对决策单元的资源配置能力、资源使用效率等多方面能力的综合衡量与评价
  • 技术效益(technical efficiency, TE)是企业由于管理和技术等因素影响的生产效率
  • 规模效益(scale efficiency, SE)是由于企业规模因素影响的生产效率

综合技术效益、技术效益、规模效益满足关系式:

CCR 模式得到的是综合技术效益,而 BCC 模式得到的是技术效益,通过上式可以得到规模效益。

什么是 BCC 模式?见下文!
  • 综合技术效益 = 1,表示该决策单元的投入产出是综合有效的,即同时技术有效和规模有效。
  • 技术效益 = 1,规模效益 < 1,表示在目前的技术水平上,其投入资源的使用是有效率的,未能达到综合有效的根本原因在于其规模无效,因此其改革的重点在于如何更好地发挥其规模效益。

2) 有效性分析

CCR 模式下 DEA 效率评估模型所得到的最优解

是决策单元
的“综合技术效益”。根据 ​
取值不同,将综合效益评估分为以下三种情况:
  • ,说明决策单元是 “DEA 强有效” 的,即任何一项投入的数量都无法减少,除非减少产出或增加另外一种投入的数量;任何一种产出的数量都无法增加,除非增加投入的数量或减少另外一种产出的数量。即:同时达到技术有效和规模有效
  • ,说明决策单元是 “DEA 弱有效” 的,无法等比例减少各项投入的数量,除非减少产出的数量;无法等比例增加各项产出的数量,除非增加投入的数量。即:技术有效和规模有效只满足一个
  • ,说明决策单元是 “非 DEA 有效” 的,存在资源浪费现象(没有合理利用资源),既不是效率最佳也不是规模最佳

对 “DEA 弱有效” 的决策按照

的冗余情况进行调整,使之变得 “DEA 强有效”。

3) 规模报酬分析

在不同的生产规模下,规模报酬将会随之改变。生产规模小时,投入产出比会随着规模增加而迅速提升,称为规模报酬递增(Increasing Returns to Scale, IRS);当生产达到高峰期时,产出与规模成正比而达到最适生产规模,称为规模报酬固定;当生产规模过于庞大时,产出减缓,则称为规模报酬递减(Decreasing Returns to Scale, DRS),也就是投入增加时,产出增加的比例会少于投入增加的比例。

规模报酬固定: 如果

,则该决策单元为“规模报酬固定”

规模报酬递增: 如果

​, 则该决策单元为 “规模报酬递增”

规模报酬递减: 如果

,则该决策单元为 “规模报酬递减”

4) 差额变数分析

投入冗余率:

为决策单元
的第
种投入资源冗余率, 定义为:

产出不足率:

为决策单元
的第
种产出资源不足率, 定义为:

差额变数分析是基于松弛变量的分析,根据冗余情况进行适当减少

(5) 其他模式

BCC 模式 :BCC 模式是从产出的角度探讨效率,即在相同的投入水准下,比较产出资源的达成情况,这种模式称为“投入导向模式”。所得到的是“技术效益”,DEA = 1 称为 “技术有效”。

交叉模式 :当决策单元的相对效率达到 1 时(或在 A&P 模式下达到了最小值),DEA 就会停止,容易造成 DEA 效率估计偏保守。交叉模式则是使用“同僚评估”的方式:对于决策单元

,进行
次 DEA 效益评估,每次都去掉 1 个决策单元,计算所有DEA 有效的效益评价指数的平均值:

这个模式本文的代码无法实现.

A&P 模式 :CCR 模式求出位于效率前沿面的决策单元,但无法进一步区分相对效率同为 1 的决策单元的好坏,A&P 模式将受评的决策单位排除在參考集合外的概念,被评为有效率的决策单位会以自身为参考点,而相对无效的决策单位则会以其他有效率的决策单位作为参考点而不会参考自己。此时评价决策单元

效率的 CCR 数学模型为(BCC同理):

4 Python 3 实现

使用的编程语言:python3.7.1 (Anaconda3)

使用的编辑器:Sublime Text 3

使用的模块:gurobipy、pandas

import 

5 案例分析及程序调用实例

案例:天津市可持续发展评价

05b2d379210feff5efd5e2037cc254a3.png

构造决策单元

投入:政府财政收入占 GDP 的比例,环保投资占 GDP 的比例,每千人科技人员数

产出:人均 GDP/元,城市环境质量指数

调用程序

data 

结果分析

eca60c34aa171ac3ef9afea325ab6464.png
DEA 分析结果

天津市可持续发展政策具有很好的效果,通过不断调整资源投入,在经济建设、生态文明建设都有显著提升。综合技术效益逐年上升,说明资源的利用率得到提升(技术效益)、尚未达到边际效益,未来具有较大的提升的空间。

6 后记

  • 优点:同时考虑多项的投入与产出属性,来评估决策单位和方案的相对效率,不依赖于人为选择权重,对于决策问题中不可度量糅合的属性具有天然的优势。对测量单位的改变不敏感,具有较强的鲁棒性。模型依赖于线性规划问题的基本算法,求解速度快。
  • 缺点:评估结果是相对效率而非绝对效率,因此效率为 1 只能说明在当前资源下不同方案同等有效,并不代表没有改进之处,模型不依赖于权重的选择,将所有的投入、产出资源认为同等重要,一定程度上损失模型的可靠性。

DEA 分析在分析多投入多产出的时候具有自然、直观的优势, 但是要注意, 它只能处理线性投入产出问题. 典型的例子就是高考成绩上, 以满分 750 为例, 我们知道要考到 700 分和 350 分所付出的时间、精力绝不只是2倍, 若使用 DEA 分析, 则会得到 700 分的同学 "DEA 无效" 的结论, 这明显是与事实相悖的. 要解决这种问题, 最合适的方法就是重新定义 “产出”.

6c58a66b0b2dc0569753a79f74709501.png

有关综合评价的部分就到这里结束了, 前前后后介绍了TOPSIS、层次分析法、熵权法、RSR、DEA, 足够解决大部分数学建模类的评价问题 (至少在解决美赛 16、17、18、19年 C 题上没有问题, 16年的教育经费分配问题上使用 DEA 有奇效) . 最后还是要强调一句, 有了人的喜好偏向才有了评价问题, 不论是什么评价模型, 都不存在严格意义上的客观与不客观之说, 具体题目具体分析, 能用最合适的、最通俗的语言能解释地通的就是好模型。

参考文献:

[1] 茆诗松, 程依明, 濮晓龙, 等. 概率论与数理统计教程第二版[M].北京: 高等教育出版社, 2011

[2] 《运筹学》教材编写组. 运筹学.第4版[M]. 清华大学出版社, 2012.

[3] Thanassoulis E, Kortelainen M, Johnes G, et al. Costs and efficiency of higher education institutions in England: a DEA analysis[J]. Journal of the operational research society, 2011, 62(7): 1282-1297.

[4] Ramanathan, R. (2003) An Introduction to Data Envelopment Analysis: A tool for Performance Measurement, Sage Publishing.

[5] 维基百科[DB/CD]. Data envelopment analysis

[6] 簡禎富博士授课 PPT


作者:张柳彬

如有疑问,请联系QQ:965579168

转载请声明出处

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值