大数据应用
文章平均质量分 88
本专栏将不定期分享大数据应用相关文章
企研数据
这个作者很懒,什么都没留下…
展开
-
大数据应用 | 机器学习与社会科学中的因果关系: 一个文献综述
因果识别是社会科学实证研究的焦点,而在大数据时代,机器学习为因果识别带来一些新的机遇与挑战。本文重点总结了机器学习对因果关系识别的价值:更好地识别和控制混淆因素、帮助更好地构建对照组、更好地识别异质性因果效应,以及检验因果关系的外部有效性。同时,本文还讨论了在大数据和机器学习广泛应用下,可能存在因果关系在某些情形下变得不再重要、大数据和机器学习会让因果效应识别更加困难,以及部分机器学习算法缺乏可解释性等情形。本文有助于拓展社会科学研究者的工具箱和思想库。转载 2023-03-23 09:17:53 · 222 阅读 · 0 评论 -
机器学习 | 这 725 个机器学习术语表,太全了!
下面是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏!转载 2023-03-23 09:18:11 · 86 阅读 · 0 评论 -
大数据应用 | 陈云松:大数据的功能
“大数据”一词在 2010 年之后爆红网络,人人视之为新的知识风口。与该词密切相关的主题,从“云计算”“数据分析”“人工智能”等计算机科学领域的专业词汇到“海量数据”“市场营销”“精准投放”等商业新概念,不一而足。对于一个新生事物市场的嗅觉往往最为灵敏,其次当属学术界。但不同于以往的是“大数据”这一学术词汇不仅在与计算机科学相关的学科中被关注,就连一向偏于保守滞后的人文社科领域的研究者也向它投去了目光。转载 2023-03-22 13:56:22 · 66 阅读 · 0 评论 -
大数据应用 | 大数据给社会学研究带来了什么挑战?
今天跟大家分享我的研究成果,我对大数据的观察,不是扫盲。为了让大家听起来尽量没有障碍,也加入了一些知识性的东西,因此,也是和各位交流。我想和大家讨论三个问题:第一,什么是大数据?人们说的很多,错误的概念也非常多,我想澄清大数据是什么?第二,大数据和社会学研究到底有没有关系?对这个问题,人们也有比较多的想法,同样也有很多误解,我要说说我的观点。第三,重点谈一谈,大数据对社会学研究的重点带来什么挑战?大数据带来的挑战特别多,对社会学研究而言,到底有什么样的挑战呢?转载 2023-03-22 10:44:25 · 333 阅读 · 0 评论 -
大数据应用 | 关于夜间灯光数据在经济学应用的探讨
近年来,夜间灯光数据越来越广泛的被经济学者使用。无论是中文期刊还是国际期刊,都出现了大量基于DMSP夜间灯光数据的分析成果。研究成果鲜有讨论DMSP夜间灯光数据自身的问题和局限。本文分享Gibson et. al(2021)在Journal of Development Economics的文章,讨论夜间灯光数据库的选择、应用问题与局限性。转载 2023-03-22 10:36:22 · 735 阅读 · 0 评论 -
大数据应用丨大数据时代的医学公共数据库与数据挖掘技术简介
本文我们将介绍几种数据库和数据挖掘技术,帮助临床研究人员更好地理解和应用数据库技术。数据挖掘技术可以从大量数据中寻找潜在有价值的信息,主要分为数据准备、数据挖掘、以及结果表达和分析。数据库技术是研究、管理和应用数据库的一门软件科学。通过研究数据库的结构、存储、设计、管理和应用的基本理论和实现方法,对数据库中的数据进行处理和分析。转载 2023-03-22 10:28:28 · 1826 阅读 · 0 评论 -
大数据应用 | 洪亮:知识图谱在金融研究中的应用
随着大数据时代的到来,知识图谱的应用也日趋广泛,在医疗健康、证券投资、大数据风控等领域都起着十分重要的作用。本次推送将回顾武汉大学洪亮副教授带来的讲座——《知识图谱在金融研究中的应用》,讲座内容从知识图谱的概念与技术到知识图谱研究与平台,深入探析了知识图谱及其在金融研究中的具体应用。转载 2023-03-22 10:33:44 · 190 阅读 · 0 评论 -
大数据应用丨大数据领域75个核心术语讲解!
近日,Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语,这不仅是大数据初学者很好的入门资料,对于高阶从业人员也可以起到查漏补缺的作用。本文分为上篇(25 个术语)和下篇(50 个术语)。转载 2023-03-22 10:30:11 · 321 阅读 · 0 评论 -
大数据应用丨数据科学入门前需要知道的10件事
对于未知的学科,琳琅满目的学习资源,美好的工作机会,应该怎样去努力?本文作者是研究数据挖掘和生物医学方向,目前就职于泰国的一所研究大学的全职生物信息学副教授。他在22岁时开始自学数据科学,目前已经自学成才,编译了这篇文章,希望能把以下需要注意的10件事告诉刚入门的你。转载 2023-03-22 10:23:56 · 298 阅读 · 0 评论 -
大数据应用丨大数据在Top5刊的研究中的应用分析及其示例
本文以四种国际公认的顶级经济学英文期刊为研究对象,分别是《经济学季刊 》 ( Quarterly Journal of Economics,QJE) 、《经济研究评论 》(Review of Economic Studies,RES) 、《美国经济评论》( American Economic Review,AER) 和《政治经济学杂志》( Journal of Political Economy,JPE) ,对其 2015 年所发论文的总体情况进行分析,重点以运用大数据进行研究的文章为案例,尝试分析大数据对转载 2023-03-22 10:21:50 · 252 阅读 · 0 评论 -
大数据应用 | MIT教授Acemogulu:有人泄露了你的数据,还让数据市场价格低廉且低效
在毛咕噜教授最近的一篇Working paper《Too Much Data: Prices and Inefficiencies in data markets》中,描述了当前互联网用户大数据市场的运行现状。他发现,当一个用户在互联网平台上共享其数据时,通常会产生一种“同时泄露其他用户的相关信息”的外部性。原创 2023-03-22 10:19:23 · 239 阅读 · 0 评论 -
学术前沿 | DMSP-OLS夜间城市灯光数据文献综述
DMSP(Defense Meteorological Satellite Program)是美国国防气象卫星计划。该项目是通过气象卫星搭载的传感器,探测出夜间低强度灯光,例如城市的灯光、车流的灯光、居民小区的灯光等。目前,获取到这些DMSP-OLS夜间灯光数据,已成为研究人类活动的不可多得数据源。Tilottama 等人(2013)发现了夜间卫星图像数据的巨大价值,这些灯光数据要相比典型的人口普查数据,折射出的信息比较综合和呈现的频次更高,且能在多个研究领域得到运用。原创 2023-03-22 10:12:40 · 1616 阅读 · 0 评论 -
学术前沿 | 行政大数据的政策研究价值
如果能够更好地获得政府项目参与者或向政府单位报告信息的人的行政记录,那么社会科学领域的政策研究将会获得很大的发展。美国经济学会的成员特别想要寻求更方便更全面地访问实施项目的联邦和州政府部门收集的行政数据。有学者认为,行政数据对评估公共项目来说非常关键,并且提供了更好理解社会经济行为的方法。原创 2023-03-21 16:58:15 · 84 阅读 · 0 评论 -
学术前沿丨大数据在劳动力市场研究中的应用与展望
互联网为劳动经济学研究提供了全新的数据收集渠道。基于互联网的劳动市场大数据具有动态性、及时性等特点,能用来分析传统调查数据无法分析的问题。本文文献分析的基础上,讨论了劳动力市场大数据的产生过程、内涵及应用,并在此基础上总了数据收集方式、测量指标,以及可能存在的问题与解决方法,最后对国内学者未来可以于大数据对劳动力市场开展的研究进行了展望,以期推动大数据在国内劳动经济学研究中的应用原创 2023-03-21 16:56:24 · 471 阅读 · 0 评论 -
学术前沿 | 规律与因果:大数据对社会科学研究冲击之反思
在社会科学中,大数据研究还刚刚起步,但也取得了一定成果。大数据为社会学和社会科学重新发现社会历史发展规律提供了可能性: 它提供了认知宏观社会、 检验社会现象的 “异质性假设”和 “结果稳定假设”的数据基础; 它以实时记录的特点较大程度上排除了获取数据时的人为干扰; 它将抽样数据中被排斥的极端值重新纳入统计分析。在因果关系上,大数据有助于从根本上克服由于抽样偏颇所引起的样本选择性偏误; 匹配数据可以克服或缓解变量遗漏问题; 作为面板数据和分层数据,大数据对 确定因果效应、检验因果关系比抽样数据更为有利、稳健和原创 2023-03-21 16:50:28 · 874 阅读 · 0 评论 -
特别推荐 | 专利引用数据,可以用来做哪些研究?
最近有不少学界的朋友向我们询问关于专利引用数据的情况。看来学界已经不能再满足简单统计企业各类专利申请、授权的数量,而希望以更丰富的专利信息为切入点对创新展开更为深入的研究。 文献检索发现,目前国内利用专利引用数据开展相关研究的文献并不多。这显然跟专利引用数据可得性较差有关。在构建并向学术和智库领域推送企业专利引用微观数据服务之前,让我们先来看看专利引用数据到底可以用来做哪些研究?存在哪些问题?原创 2023-03-21 16:42:29 · 723 阅读 · 3 评论 -
学术前沿 | 私人部门数据的经济学应用
由于传统商业受到市场准入和地区间市场分割的限制,互联网商业模式对中国经济的影响远远超过传统商业模式发达的西方发达国家。在中国,阿里巴巴、腾讯、百度、京东等互联网巨头所掌握的有关中国消费者和个人用户的信息不会少于作者在文中提到的美国任何一家互联网公司。有人说,大数据之于未来商业相当于石油之于现代工业,是必不可少的战略资源。而正如作者在文中所阐述的,这些数据资源也同样能够给经济学研究带来巨大的机遇。对于中国学者而言,微观经济数据的缺乏和传统经济统计数据低劣的质量,就像梦魇一样会伴随其整个职业生涯。如今,非传统的原创 2023-03-21 16:31:38 · 153 阅读 · 0 评论 -
学术前沿 |超越预测:用大数据做政策分析
机器学习的预测方法被有效应用于从医学到城市中消防和卫生检查员的分配等多个领域。 然而,在预测和决策之间仍存在不少差距,为了优化数据驱动(data-driven)的决策,需要理解机器学习预测方法的潜在假设。原创 2023-03-21 16:23:54 · 401 阅读 · 0 评论 -
基于大数据方法的经济研究:前沿进展与研究综述 | 特别推荐
随着数据挖掘和分析技术的不断提高,基于大数据方法对经济的研究日益增多,大数据对经济研究和应用具有重要的现实意义。本文梳理了近年来国内外基于大数据方法研究经济的文献,根据经济研究中使用大数据的目的将其大致归纳为3 类:优化传统经济指标或构建其先行指标、构建新的经济预测指标、寻找建立经济变量间的联系。本文介绍了基于大数据方法处理海量非结构化数据并从中获取有效信息的一般方法和主要阶段特征:数据抓取和数据分析,介绍了目前经济学在大数据挖掘和分析方面的主流工具和算法,从经济预测和验证经济理论两方面阐述了目前基于大数原创 2023-03-21 16:27:20 · 905 阅读 · 0 评论 -
文献回顾 | 你还在这样使用工业企业数据库吗?
众所周知的是,中国工业企业数据库是国内外学者研究我国企业经营状况与问题的主要数据库,且是目前我国体量最大、指标最全面的可获得企业级数据库。基于该数据库,已有大量国内外经济学者进行了相关研究,主题涵盖了企业理论、产业组织理论、公司金融、国际贸易等诸多学科。如《中国工业企业数据库的使用现状与潜在问题》所说该数据库的应用过程中总是伴随着样本匹配混乱、变量大小异常、测度误差明显和变量定义模糊等问题。将该文内容总结如下:第一部分,中国工业企业数据库的优点,第二部分,数据库应用范围,第三部分,数据库潜在问题与部分解决原创 2023-03-21 16:34:53 · 4214 阅读 · 0 评论 -
学术前沿 | 行政部门数据在经济学中的应用
从来源上讲,我们可以将近些年被越来越多学者所“青睐”的“大数据”分为行政部门数据和私人部门数据两大类。与采用抽样调查数据一样,不同类型数据的应用存在共性,但也存在许多明显的区别。基于文献阅读和研究,后面我们将逐渐分两个系列介绍上述两类大规模数据当前的学术应用情况,它们依次是: “行政部门数据学术应用系列”、“私人部门数据学术应用系列”。原创 2023-03-21 16:29:24 · 173 阅读 · 0 评论