大数据应用丨大数据在Top5刊的研究中的应用分析及其示例

本文转载自公众号计量经济圈
Source: 阳军.大数据在国外经济学研究中的应用分析——以2015年四种经济学期刊为例[J].国外社会科学,2016(05):129-134.

2010 年前后,大数据概念异军突起,蓬勃发展。2012年,美国政府投资两亿美元启动“大数据研究和发展计划”,将大数据上升到国家战略层面。2013年,大数据这一概念全面进入政府、学界和社会各界的视野,有媒体甚至称这一年为“大数据元年”。

本文以四种国际公认的顶级经济学英文期刊为研究对象,分别是《经济学季刊 》 ( Quarterly Journal of Economics,QJE) 、《经济研究评论 》(Review of Economic Studies,RES) 、《美国经济评论》( American Economic Review,AER) 和《政治经济学杂志》( Journal of Political Economy,JPE) ,对其 2015 年所发论文的总体情况进行分析,重点以运用大数据进行研究的文章为案例,尝试分析大数据对经济学研究的影响。

一、2015 年四种经济学英文期刊基本情况分析

2015 年,在经济学英文期刊SJR排名中,《经济学季刊》、《经济研究评论》、《美国经济评论》和《政治经济学期刊》四种综合性经济期刊进入前十名,其余六本为金融类 和计量经济期刊(见表1) 。

从论文作者的数量来看,四大期刊的研究以合作研究为主,独立作者的论文比例仅为18% ,两位作者的论文比例约41% ,三 位及以上作者的论文比例约 41% (见表2) 。20世纪60年代以来,顶级综合类经济研究期刊的合作研究趋势增长明显,1963—2003年期间,两位及以上作者的论文比例几乎每十年增长十几个百分点。而 21 世纪以来,合作研究虽然仍保持增长趋势,但速度明显放缓,2015年的合作研究论文比例(82%) 仅比2003年增 长8个百分点,与 2011 年(74% )基本持平。

随着互联网技术的迅速发展和大数据概念的兴起,近10~20 年 来,经济学中的量化研究数据源发生了巨大变化。21世纪以前,经济学研究的量化研究以调查问卷、样本分析为主,经济学家主要依靠人工从图书馆查阅统计报告获取数据。进入21世纪后,经济研究所需要的数据获取量海量增加,而且呈现出两大特点。一是数据可以实时获取。政府统计数据一般在几个月或一年之后就会发布,数据更新速度大幅提高。互联网、社交媒体上的数据更是实时更新。数据的及时更新对分析宏观经济形势和制定经济政策具有重要意义。二是对传统研究方法难以测量的人类活动可以进行数据统计和分析,例如人与人的交往、社交网络、地理位置信息等。这两大特点促进了以定量研究为主的美国经济学研究领域的扩展、对象的多元化和研究方法的丰富。以下对2015年四种综合类经济期刊中典型的大数据应用案例进行介绍和分析。

二、传统经济研究领域中的大数据应用

1. 行为经济学:天气与购车的关系

在《经济学季刊》2015年第1期的论文《天气对购买汽车的心理影响》中,布塞、D.C.波普、J.C.波普和席尔瓦-里索四位经济学家对天气对人们购车决策的影响进行了研究。

作者从全美多家汽车经销商手中抽取了其2001年1月1日到2008年12月31日期间20%的销售记录作为分析样本,包括4000多 万 条 汽 车 销 售 数 据。根 据 尼 尔 森(A.C.Nielsen)指定市场区域法(DMAs),作者将全美划分为200个区,分析各区内不同时间的汽车销售情况。然后,作者再将各区各时段的天气数据与汽车销售数据进行比对,从而分析二者的关系和相关度,来检验天气变化对人们购车行为的影响。关于天气数据的取得,作者首先从 wolframalpha.com 网站上找到各区附近的气象站,然后运用一款数学软件(Mathematica)下载了天气数据,并进行处理和分析。

研究发现,在控制季节趋势的情况下,温暖的天气会增加敞篷车销售:当日气温每比平均气温高出10华氏度(约5.6摄氏度), 敞篷车销售数量会增加2.7%,敞篷车占总汽车销售数量的比重会增加0.007%;相反,当日气温每比平均气温低 10华氏度,四轮驱动型汽车销售占比会增加0.32%。云层厚度、降水降雪量等其他天气指标也会对汽车购买产生相应影响。

2. 农业经济学:土地确权与人口流动

《美国经济评论》2015年第10期发表了詹弗里、埃默里克、冈萨雷斯-纳瓦罗和萨多莱特合写的论文《农业土地产权、土地使用与劳动力迁移:以墨西哥为例》,以墨西哥大规模土地确权项目为研究对象,考察了土地确权对人口流动的影响。

考察确权对劳动力空间再分配的影响具有十分重要的现实意义,墨西哥的土地许可证确权项日为该文作者提供了研究机会。1914—1992年,墨西哥实行一种公共用地制度,每个农民分有一小块土地并拥有使用权和剩余索取权,其前提是必须亲自或由亲人进行连续耕作而不能转手或闲置。由于认识到这一模式的低效率,墨西哥政府于1993年开始在全国范围内进行土地制度改革,通过颁发许可证确定农户对土地的产权,之后农户便可自行处理所拥有的土地。

基于墨西哥1995—2012年43万个农庄的数据,作者通过建模预测,然后进行实证检验,发现采用正式的许可证制度对产权进行重新确认明显造成了农村人口外流的趋势。研究发现,与其他家庭相比,拥有土地许可证的家庭向外移民的概率高 28%,通过测算, 移民中的20%(约7万人)都是由这一确权改革导致的。接下来,作者还考察了这一移民影响的异质性:对于改革之前土地产权拥有程度较弱的农户、外出工作工资收入更高的农户、拥有土地质量更为贫瘠的农户、拥有土地数量更为稀少的农户,确权改革所带来的移民影响更大;确权改革后农业经营的规模反而增加了5%~10%。

3. 人口经济学:女性劳动供给与婴儿潮

《经济研究评论》2015年第3期发表了德普克、哈赞和毛兹合写的《婴儿潮与第二次世界大战:宏观经济视角的分析》一文,从宏观经济学视角考察了女性劳动供给与婴儿潮之间的关系。

在第二次世界大战结束后的 20多年时间内,美国经历了一次婴儿潮,人口出生率大幅提高。为了解释战后人口出生率的突升, 作者利用1940—1960年48个联邦州人口普查中综合公共使用微观样本(IPUMS)1% 的数据,借助定量动态一般均衡模型进行实证检验,认为女性劳动供给变化是一个主要原因。研究发现,人口流动率越高的地区,战后年轻女性的工作参与率越低,结婚率和生育率越高,婴儿增加量越多。而且已婚夫妇的生育决策与女性是否外出工作有着密切关系,女性劳动力的供给变化可以解释80%的生育率变动。

三、新经济研究领域中的大数据应用

1. 互联网的技能互补性

经济学家和政策制定者一直关注信息技术对企业生产率和劳动力市场的影响。许多研究认为,1990年后,美国生产率的提高应归因为信息技术投资。近年来,越来越多的政策制定者开始关注互联网对经济产生的影响,李克强总理在 2015年的政府报告中也首次提出了"互联网+"。国内外有关互联网如何影响生产率和就业的文献比较有限,但近年来在不断增加《经济学季刊》2015年第4期就刊登了题为《互联网的技能互补性》的文章,以挪威为案例,对这一问题进行了研究,通过数据和模型分析了互联网与劳动生产率、劳动力工资和就业等之间的相互关系。

该研究运用了四组数据,均来自挪威官方统计。第一组是企业与劳动力数据,选取2000—2008年所有非金融股份有限公司的数据。这些数据来自政府登记信息,由挪威统计局每年更新,税负局负责验证。第二组是互联网数据,包括 2001—2007年企业宽带用户分层抽样和城镇一级家庭宽 带用户信息。企业宽带用户数据来自挪威统计局对企业通信技术的年度调查,家庭宽带用户信息来自负责宽带入户的挪威行政与改革部。第三组是社会一经济数据,包括 2000——2008 年居民受教育程度、收入、被雇佣信息等。这类数据来自挪威统计局。第四组是小时工资和就业数据,包括 2000—2008年小时信息统计调查,也是来自挪威统计局。每组数据体量都很大,动辄数十万计乃至数千万计,例如2001—2007年就业率的计算基数以千万计, 18~67岁年龄层人口就有2000多万。

通过数据匹配与分析,作者发现,互联网增加(降低)了高(低)技能劳动力的生产率, 互联网增加了高技能劳动力的工资和就业, 但降低了低技能劳动力的工资。也就是说, 互联网与高技能劳动力之间存在互补关系, 与低技能劳动力之间存在替代关系。最后, 作者认为,基于信息革命的新技术更容易替代常规性劳动就业(通过计算机编码可以进行替代,如会计、文秘、柜员等),但增加了抽象劳动就业和手工劳动(如保姆、理发师等)的就业比例。这说明,互联网是技能偏向型的技术进步,与抽象劳动之间的关系是互补的,但与常规性劳动的关系是替代的。

2. 宗教信仰与经济增长和幸福感的关系

《经济学季刊》2015年第2期发表了坎潘特和柳泽-德罗特的论文《宗教信仰是否会带来经济增长和快乐?穆斯林斋月的实证研究》,考察了宗教对经济增长和个体幸福的影响。

该研究同样运用了四组数据。第一组是斋月期间规定的禁食时长,来自美国海军天文台的在线信息。第二组是1945—2010年期间每五年的信徒数量变化,来自世界宗教项目(World Religion Projec,WRP)。第三组是1950—2011年的经济增长数据,主要是人均GDP每年的实际增长数据,来自佩恩表8.0(Penn World Tables 8.0,PWT8.0)。第四组是穆斯林的幸福感指数,来自第六次世界价值观调查(World Values Survey,WVS),涵盖了1981—2014年的97个国家共33万人的调查数据,其中包括生活在83个国家的7.2万穆斯林。

研究结果显示,禁食时间越长,对经济增长的不利影响越明显。而且无论以人均GDP还是GDP总量、GDP年度增速还是GDP五年平均增速来衡量经济增长水平,这一结论都是成立的。以孟加拉国和土耳其为例,在最为极端的情况下,两国的日禁食时长相差1.4个小时,这最终表现为经济增长率上1个百分点的差异。

在宗教对个体幸福感的影响方面,作者发现,斋月禁食能显著提高穆斯林的快乐程度和生活满意度,而这种负向经济影响和正向幸福影响对非穆斯林个体和国家则不存在。此外,作者还发现,随着斋月禁食严格程度的加强,参与禁食的人会明显减少;而且随着这部分人的离去,留下的禁食参与者对伊斯兰信仰虔诚度也更高。这意味着禁食时间的延长、严格程度的提升可以有效减少搭便车行为,进而提升伊斯兰教徒的整体福利水平。

四、小结

从选取的研究期刊来看,2015年国际经济学研究一方面秉承了一贯的传统,另一方面在互联网和大数据的影响下呈现出新的变化。

1.研究领域广泛,合作研究占主流

微观经济和宏观经济依旧是经济学研究的两大主要领域。在微观经济研究方面,所选取的2015年国际经济学研究期刊的文章十分接地气,研究主题涉及企业员工工作方式的变化、宗教对经济增长和幸福感的影响、已婚女性在产权中的地位、同伴压力对于青少年学生学习决策的影响,等等。宏观层面研究包括资源对国家间关系的影响,特别是对带来战争的可能性的研究;通过人力资本对工业化的影响的研究来强调人力资本的重要性;对企业项目选址的经验研究;海外金融资产的发展催生了英国的代议体制的实证研究;等等。

无论是微观经济研究还是宏观经济研究,多位作者的合作研究依旧占据主流,合作论文的比例超过80%,而且不拘于同一大学或研究机构内不同学者的合作,跨机构、跨地区乃至跨国合作也十分常见。例如,《经济学季刊》中跨国合作论文的比例从2010年的6.98%增长到2015年的36.59%,2014年这一比例甚至达到 46.67%。在部分期刊中, 跨国合作的论文比例甚至超过一半。《美国经济评论》和《政治经济学杂志》2010年以来的这一比例基本在 20%~40%的区间上下浮动,《经济研究评论》的这一比例略高一些,维 持在 30%~50%,2014 年一度 达到55%。

2. 互联网和大数据催生新的经济研究领域

一方面是互联网的飞速发展催生了新的经济现象,引起学者的关注。例如,《互联网的技能互补性》研究了互联网与劳动力的技能互补或替代关系;《经济学季刊》2015年第1期的《是否在家工作?来自中国实验的证据》一文基于互联网技术不断发展、人们工作时间和空间不断拓展的背景,对中国的实际案例进行分析,从微观经济政策层面分析了在家工作是否可行。

另一方面,传统抽样和调查方法难以测量的人类活动在大数据时代变得可以被量化,从而使某些研究领域变得可能。例如,在以往的经济学研究中,宗教和经济的关系很少被关注。2000—2015年,《经济学季刊》和《美国经济评论》以"宗教"为主题的研究仅有9篇,其中,研究宗教和经济关系的论文, 除了前面介绍的《宗教信仰是否会带来经济增长和快乐?穆斯林斋月的实证研究》和《美国经济评论》2015年第5期的《宗教与创新》(Religion and Innovation)外,之前仅有《经济学季刊》2009 年第3期的《朝觐的影响:伊斯兰教的全球聚会中的宗教与宽容》(Estimating the Impact of the Haij:Religion and Tolerance in Islam's Global Gathering)一文。《朝觐的影响》一文的量化分析仍然采用传统的问卷调查法,调查对象仅有1600名逊尼派穆斯林,无论是数据体量还是可分析的变量,与《宗教信仰是否会带来经济增长和快乐?》一文都相距甚远。

3. 大数据促进经济学研究方法的新发展

无论是传统研究领域,还是新的研究领域,大数据为传统经济学研究方法提供了新的思路和路径。首先,数据的获取方式和途径发生了变化,传统的数据获取主要依靠对政府公布的统计报告进行人工整理,或问卷调查、抽样调查、普查等。而信息时代的数据获取渠道多样,如官方统计信息数据库、销售商的电子销售记录、网络等,信息技术也使数据处理更为便捷。

其次,对数据的使用不再单纯依赖抽样, 还可以对样本总体进行运用。维克托迈尔-舍恩伯格(Viktor Mayer-Schonberger)在其《大数据时代》一书中指出,"我们需要的是所有的数据,'样本=总体'"。他认为,社会科学经典的随机采样方法固然取得了很大的成功,但"这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷"。大数据时代对样本总体的使用可以与传统研究方法相结合,取长补短。

最后,数据分析不拘泥于探求复杂的因果关系,而更注重相关关系。这一点从本文列举的几个经典案例均可以看出。但是这并不意味着经济学研究不再需要探求因果关系,而是减弱了因果关系的重要性,让学者更注重事物之间的相关关系,通过分析数据之间的相关关系,来发掘数据中的价值。

数据Seminar

这里是大数据、分析技术与学术研究的三叉路口

出处:计量经济圈

推荐:谈佳辉

排版编辑:青酱

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值