多期数据DID操作

最新推荐文章于 2024-07-17 08:15:00 发布

spssau

最新推荐文章于 2024-07-17 08:15:00 发布

阅读量2.2w

点赞数 4

分类专栏：数据分析 SPSSAU 文章标签： DID SPSSAU 计量经济

本文链接：https://blog.csdn.net/m0_37228052/article/details/118358510

版权

SPSSAU 同时被 2 个专栏收录

203 篇文章

订阅专栏

数据分析

191 篇文章

订阅专栏

多期DID常用于政策评估效应研究，比如研究‘鼓励上市政策’，‘开通沪港通’，‘开通高铁’，‘引入新教育模式’等效应时，分析效应带来的影响情况。

案例背景描述

比如有50个地区分别11年（2010~2020）的数据（共计50*11=550行）。50个地区可分为两类地区A和B(分别均为25个)，在2016年A类地区没有开通高铁，B类地区开通高铁。那么开通高铁对于GDP的影响情况如何呢？

涉及两个关键数据，分别是Treated和Time，此处Treated为地区（A和B两个地区），以及时间项Time(高铁开通前和开通后)。同时研究‘开通高铁’参于GDP的影响，那么被解释变量Y即为GDP，与此同时还涉及可选的控制变量（控制变量为可选项，多数情况下并不需要），比如教育投入，人口或对外投资情况等，如下表说明。

preview

特别提示：

Treated只能为数字0或1，且一定包括此2个数字。其用于标识研究‘效应’对应的组别，数字0标识‘控制组’，数字1标识‘实验组’，一定需要这样处理。
Time只能为数字0或1，且一定包括此2个数字。其用于标识研究‘时间’对应的组别，数字0标识‘before’（实验前），数字1标识‘after(实验后)，一定需要这样处理。

1 数据格式

多期面板数据进行DID分析时，数据格式类似如下图：共计50个地区分别11年的数据，那么就应该为50*11=550行数据，加上第1行为标题即最终为551行数据。多期DID分析时共需要多出3列数据，分别是time，treated，treated*time，说明如下：

preview

针对treated：A地区全部为数字0，B地区全部为数字1；

针对time：2020~2015全部是数字0代表高铁开通前，2016~2020全部是数字1代表高铁开通后；

针对tretaed*time，其为treated与time的乘积项，即交互项。

preview

2 数据处理

如果说数据已经是面板格式，但是没有treated，time，treated*time这三项数据，此时可使用SPSSAU->数据处理模块里面的‘数据编码’和‘生成变量’功能。使用数据编码功能时，将地区编码为01格式的treated，将年份编码为01格式的time，并且使用生成变量得到treated与time的交互项。操作分别如下各图：

以年份为例进行数字编码如下图（当然也可使用范围编码），

数据编码完成后，分别得到treated和time数据；

当然数字0和1代表的意义需要自己进行标识（便于画图时使用），可使用数据处理里面的数据标签功能标识下即可。
如果需要修改标题的名称，可使用数据处理里面的标题处理功能。
接着使用生成变量功能的‘乘积(交互项)’得到treated和time的交互项，操作如下图：

3 SPSSAU分析多期DID

由于是面板数据，因而使用SPSSAU计量研究模块里面的‘面板模型’进行具体分析，操作如下图：

面板模型时打勾‘双向固定’模型（即输出结果中最终使用‘双向固定’模型对应的结果；
分别放入被解释变量（或因变量，此处为gdp）,解释变量（或自变量，即交互项treated*time），以及将地区和年份放入对应的框中（以告诉系统此处为面板模型）；
关于treated和time这两项，一般并不需要放入模型中，如果模型中有控制变量可直接放入对应解释变量(自变量X)框中就好。
最终输出结果中，直接分析交互项（treated*time）的显著性即可，如此其显著，则说明具有‘某效应’（此处为高铁效应），显著后如果回归系数大于0则为正向效应，反之则为负向效应。如果不显著，则说明没有‘某效应’。

preview