上学期的面板数据分析课程大作业是复制一篇经典文献,我选择了一篇运用DID方法的教科书般的文献——Compulsory Licensing:Evidence from the Trading with the Enemy Act。把复制过程(相当于全文翻译啦)分享给大家,请大家尊重一下我辛辛苦苦的知识版权哦,不要随意转发~
论文介绍
题目 Compulsory Licensing:Evidence from the Trading with the Enemy Act, Petra & Alessandra, ARE, 2012.
研究背景 强制许可制度(Compulsory Licensing)允许发展中国家无需征得专利国同意而使用而生产外国专利产品,但关于该制度的讨论往往忽视了一个重要问题——强制许可效应究竟是促进还是抑制了专利使用国的发明创造水平?
强制许可效应同时具有促进和抑制国内创新的作用机制:促进作用表现在,专利使用国在生产外国专利产品的过程中,可形成自己独立的产品,从而增加了对本国相关产品的研发和技能掌握的创新投资,同时提供了开展“干中学”(具有时滞的特征)的机会;抑制作用表现在,当一国可以在低于市场利率下使用某外国专利时,这就降低了该国的研发本国替代性产品的激励。
研究问题 强制许可制度究竟是促进还是抑制了国内的发明创造水平?
研究方法 可以通过一个外生事件(自然实验)来识别强制许可效应。1917年10月6日,美国国会发布了《敌国贸易法案》(Trading with the Enemy Act, TWEA),该法案允许美国企业侵犯敌国专利,只要这些专利可以为战争做出贡献。
在控制一些可以促进国内创新的变量——例如教育水平、科研培训、关税壁垒等——的基础上,使用双重差分方法(DID)比较受到TWEA影响的科技行业的国内企业专利数量的变化。在排除其他因素的干扰后,可以测度强制许可对国内技术发明的影响。
数据 科技行业选取:美国专利与贸易办公室(United States Patent and Trademark Office, USPOT)的有机化学产业。有机化学行业中共有19个主行业(包含7248个子行业)受到了TWEA的影响,这些类别在1875年至1939年间共产生了128953项专利;336个子行业被作为处理组对待。国内专利数量的变化由该行业中的美国企业的专利授权年度数据来衡量。
主要结果 受到TWEA影响的子行业的国内技术发明得到了极大增长;在TWEA法案出台后,至少得到一个专利授权的子产业, 比未得到强制许可的子行业平均每年多出0.151个技术发明,比平均水平的0.619个技术发明要高出25%。
论文复制(软件版本为stata 16)
一、 TWEA作为强制许可的自然实验
一战期间,德国与美国之间的专利竞争被迫暂停;但在1920年代,德国企业迅速回到了美国市场,并且恢复了专利申请。(见图一)
根据licensed_class的值区分全样本(值为0)和处理组样本(值为1),分别令两个组别的德国专利数量变量(count_ger)对时间虚拟变量td*做不包含截距项的回归,保存回归结果并输出到word文档中。
use "fig1.dta", clear
reg count_ger td* if licensed_class==0, noco
est store all
reg count_ger td* if licensed_class==1, noco
est store treated
esttab all treated using table1.rtf, not
根据回归结果,在Office中可绘制下图:
二、 数据
- 解释变量数据:被授权的敌方专利数量
在TWEA影响下,美国共剥夺了超过4500项化工发明相关的外国专利;其中,Chemical Foundation在1919-1926年间将727项外国专利授权给了326家美国企业。被授权的专利覆盖了336个化工类初级和二级子行业,这336个子行业被作为处理组对待。其中,绝大多数的子行业只接受到了一项专利,少数子行业接受的专利数量超过了15项(见图二);平均而言,每个子行业接受的专利有效期为23年(见图三)。
制作图二。keep命令选择1930年的专利数据,对专利数量(count_cl)变量进行降序排序;在Office中绘制336个对照组的专利数量。
use "chem_patents_maindataset.dta", clear
preserve
keep if grn==1930
gsort -count_cl
browse count_cl
restore
制作图三。keep命令选择1930年的专利数据,对专利数量(count_cl)变量进行降序排序;在Office中绘制336个对照组的专利有效年限。
preserve
keep if grn==1930
gsort -year_conf
browse year_conf
restore
2. 被解释变量数据:美国国内发明创造专利数量
1875-1945年间,在TWEA的影响下,美国化学产业19个主行业(7248个子行业)的国内发明创造专利共计128953项;其中336个子行业被作为处理组对待。国内专利数量通过将总的专利数量减去国外专利数量得到。专利从申请至授权的中位数年限为3年。
3. 测量误差和衰减偏误
测量误差来源:1)专利发明者国籍的分配方式,可能过高估计国内专利数量,但误差较小;2)用以识别国外发明者的光学字符识别方法,可能过高估计国外专利数量,但误差较小(手动收集数据的结果显示,手动方法和算法分配方法的结果差别不大,见表一);3)USPTO分类方法,专利发明会根据子类别的不同而变化,在回归中控制子类个体效应可解决该问题;另外,假定处理效应只发生在处理组,不考虑处理效应会溢出到其他子行业的话,会低估强制许可效应。
使用tab命令生成手动收集的专利发明国的频率计数,总数为625项;codebook命令查看if条件指定的(算法生成的)专利发明国的专利数量。根据命令运行结果,在Office中可绘制表一。
use "table1.dta"
tab true_nat
codebook patnum if usa==1
codebook patnum if germany==1
codebook patnum if usa==0 & germany==0
三、结果
DID模型设置与OLS回归
该模型为省略控制组和政策发生虚拟变量的简化DID模型,交互项系数仍为标准的双重差分估计量。其中,控制变量Zc,t表示国外发明的专利的总数量;δt和fc表示时间固定效应和子行业的个体固定效应。
根据前文定义的数据,运行如下命令:forvalues循环语句生成年份虚拟变量;xtreg命令作OLS回归,使用子行业层面的聚类标准误处理解释变量序列相关问题,每个回归均包含双向固定效应;outreg2命令将多项回归结果储存在Excel表格中。OLS回归结果如表二所示。
use "chem_patents_maindataset.dta"
forvalues x=1876/1939 {
gen td_`x'=0
qui replace td_`x'=1 if grn==`x'
}
xtreg count_usa treat count_for_2 td*, fe i(class_id) robust cluster(class_id)
outreg2 using ols_table2.xls, replace //(该回归结果未显示在table2中)
xtreg count_usa treat count_for td*, fe i(class_id) robust cluster(class_id)
outreg2 using ols_table2.xls, append //(table2 colume1)
xtreg count_usa treat td*, fe i(class_id) robust cluster(class_id)
outreg2 using ols_table2.xls, append //(table2 colume2)
xtreg count_usa count_cl count_for td*, fe i(class_id) robust cluster(class_id)
outreg2 using ols_table2.xls, append //(table2 colume4)
xtreg count_usa count_cl count_cl_2 count_f