ols残差_计量经济学学习笔记(1)——OLS与潜在因果框架

5fce8dc15dcfad2d1d50d160f893b4c5.png

上一篇文章提到了在AER、JPE上发表过文章,在LSE拿到终身教职的一流华人经济学家许成钢教授提到的制度经济学中“五个不相关”理论基准,这种提纲挈领的理论基准确实是我们理解一个学科的良好的开端。在1月18日—1月20日于西安举办的“微观计量经济学方法与实证论文写作”的培训中,张川川老师也是从简单的OLS到Rubin Causal Model为我们建立了关于计量经济学的理论基准(benchmark)。听过之后,收获良多,遂把学到的知识与一些思考整理成文。

当然了,本文的大部分观点都来源于教过我计量的王立勇老师、杨武老师、张川川老师,以及一些经济学教材(还有复旦谢识予老师的计量经济学视频)。因此本文只能称为学习笔记。对于重要的观点,我尽量遵循学术习惯表明引用。

计量经济学或是经济学的根本使命是“透过现象看本质”,这里的“看”具有发现规律、验证理论、进行预测的意味。而我们观测到的 “经济规律”、“经济理论”本身就存在二重性:即观测结果是一般性和个体异质性共同作用的结果。一方面,作为理论,必须要有一般性,能展现“经济世界中存在着的规律性的机制”,而另一方面,理论只能是“通过经济个体的行为”才得以表现。因此,进行计量经济学分析,本质就是在可测度的现实中识别确定性(组特征)和随机性的过程(个体异质特征)。而这种识别的起点是建立在对个体异质性(随机扰动及其分布)所做假定的基础上。做出假定的必要性是:如果是确定性理论(可以识别的组特征)与不确定性扰动(不可识别的个体异质性)结合,我们只能得到不确定的知识;而更进一步,不确定性知识加上对不确定性的度量(对个体异质性的假设)我们才能得到有用的知识。【本段总结自川川老师第二讲PPT p10-p12】

(对于知识的生产过程,系统论与还原论有不同观点,川川老师这里带有系统论的视角,而我2月想梳理的的不确定性经济理论是努力以还原论为出发点解释经济现象。此处算是立flag+广告)

当然,计量经济学的理论基准即为高斯—马尔可夫定理,即在给定经典线性回归模型的假定之下,最小二乘估计是具有最小方差的线性无偏估计量。(经典假设:线性性、条件零均值、球形扰动)

所以我们对于计量经济学的梳理和学习要从OLS和其假设开始。杨武老师说过一句很有启发性的话,“宏观经济学可以从控制论的角度去理解,计量经济学则可以从信息论的角度去理解。”我后来反复琢磨,觉得从信息论或者信息传递的视角理解OLS确实能够得到比较直观的阐释。我们的手里的经济数据就好比信号站接收到的一段波,我们要区分出信号和噪声,就要对信号和噪声有一些假定,对这段波也有一定的要求。川川老师讲的“变化(variation)越丰富,估计越有效”,其实可以对应到信息熵越大,事件带来的信息量越多。反向类比,如果别人讲话声音传过来没有(缺少)轻重起伏,我们很难识别出这个声音在讲什么,对于自己的猜测推断也会缺乏信心。而OLS的初衷是“残差平方和最小”,即进入扰动项的信息尽量少,保证有最多的信息被确定性的部分表达出来。然而这个诉求从信息获取的角度来说是符合目标的,但是对于经济学来说是不足的。经济学更加关心因果效应(causal effect)。因此我们在提取信息的基础上,还需要一个目标是识别因果的框架。

人们对于因果推断的定义是不断前进的。张川川老师的PPT(第二讲p15)梳理了不同经济学家的定义:

fc13cfbb4c74fb365f964ebc3b8f4f08.png

即在我们传统的分析框架下,我们要么在比较经过处理(W)前后的两组样本,要么在用处理过的一组样本和没处理过的样本进行比较,即Y(1)-Y(0);而真正体现因果效应的,应该是平行时空里没被处理的个体与这个时空里被处理的个体的比较,即Yi(1)-Yi(0)。由于平行时空我们还不能观测,因此Yi(0)(或Yi(1))通常是不存在的,与事实相悖的。因此我们把这种定义因果关系的框架叫做潜在结果分析框架(Rubin CausalModel),或者叫反事实(counterfactual approach)。潜在结果分析框架提供了一种思考问题的新观点。OLS方法的计量方程Yi=a+bWi+ui,b其实是在估计W带来的平均处理效应。而倚赖b进行的因果推断其实背后隐藏着极强的两个假设:1,W对于Y是线性关系影响。2,样本是同质的。

那我们如何识别因果效应呢?这里需要对于这个处理W的生成过程加以区分讨论。

如果是理想状态,处理状态(W)是随机发生的(RCT),那我们无需任何控制,直接简单回归即可得到对于因果效应的估计。我们需要设计严密的实验来满足这个条件。而实验一来社会成本巨大,二来实验要求处理组与对照组不能相互影响(Stable Unit Treatment Value Assumption)。现在想起来大一读的《隐性动机—日常生活中的经济学和人类行为背后的动机》这本书里的实验设计确实非常精巧。

更加常见的状态是我们需要面对非实验的数据。当对处理W的分配的概率与结果无关时,我们分两种情况。第一种是对于W的影响因素可观测,则我们采用多元线性回归或者matching的方法进行控制;第二种是对于W的影响因素不可观测,则我们则必须“构造”反事实,可以采用IV(工具变量)、RD(断点回归)、DID(差分)等方法。

还有很多问题,比如一致性与有效性的权衡取舍、内部有效性与外部有效性、三个方法的具体介绍,就等着后面慢慢写文章填坑吧。25号开始得投入到数学建模比赛中,今晚得多睡一会。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值