人工智能 2021年指数报告3_2000-2021年人工智能模型的指数增长-CSDN博客

报告首先概述了人工智能(AI)的研发工作，因为研发是人工智能发展的基础。自上世纪50年代这项技术首次引起计算机科学家和数学家的关注以来，人工智能已发展成为一门具有重要商业应用意义的主要研究学科。人工智能出版物的数量在过去20年里急剧增加。人工智能会议和预印本档案的兴起扩大了研究和学术交流的传播。包括中国、欧盟和美国在内的主要大国都在竞相投资人工智能研究。研发章的目标是在这个日益复杂和竞争激烈的领域中取得进展。

本章首先使用Elsevier/Scopus和Microsoft Academic Graph (MAG)数据库的数据，以及arXiv论文预印本库和Nesta的数据，分析人工智能出版物，从同行评议的期刊文章到会议论文和专利，包括每种出版物的引用影响。它考察了主要人工智能实体和地理区域对人工智能研发的贡献，并考虑这些贡献是如何塑造该领域的。第二和第三节讨论主要的人工智能会议和GitHub上的研发活动。

各章英文提要

2019 - 2020年，人工智能期刊发文量增长34.5%，增速远高于2018 - 2019年(19.6%)。
在每个主要国家和地区，同行评议的人工智能论文来自学术机构的比例最高。但第二重要的发起者有所不同:在美国，企业附属研究占全部出版物的19.2%，而在中国(15.6%)和欧盟(17.2%)政府是第二重要的。
2020年，中国在人工智能期刊的全球引用份额上首次超过美国，2004年在人工智能期刊的总发表数量上短暂超过美国，然后在2017年重新占据领先地位。然而，在过去十年里，美国被引用的人工智能会议论文一直(而且明显)多于中国。
为应对COVID-19，大多数大型人工智能会议都以虚拟方式举行，因此出席人数显著增加。2020年，参加九场会议的人数几乎翻了一番。
仅在过去六年中，arXiv上与人工智能相关的出版物数量增长了六倍多，从2015年的5478份增至2020年的34736份。
2019年，人工智能论文占全球所有同行评议科学论文的3.8%，高于2011年的1.3%。

1.1出版物

本节介绍来自Elsevier Scopus数据库的数据。Scopus收录了来自5000多家国际出版商的7000万份经过同行评议的研究项目。以下显示的2019年版本的数据来自一套全新的出版物，因此所有同行评议的人工智能出版物的数据与前几年的人工智能指数报告的数据不同。由于索引出版物的方法发生了变化，数据集的准确性从80%提高到了84%(参见附录了解更多细节)。

在全球、东亚和其他地区同行评议的人工智能出版物总数中，按地区1排序。太平洋保险公司自2004年以来一直占据着最大的市场份额，其次是欧洲保险公司;中亚和北美(图1.1.2)。2009年至2019年期间，南亚和撒哈拉以南非洲同行评议的人工智能出版物数量增长最快，分别增长了8倍和7倍。

通过地理区域来比较世界主要人工智能参与者的活动，本部分展示了来自中国、欧盟和美国的同行评议人工智能出版物的趋势。截至2019年，中国同行评议的人工智能出版物在全球的份额领先，此前中国在2017年超过了欧盟(图1.1.3)。与2014年相比，中国2019年发表的同行评议的人工智能论文是2014年的3.5倍，而欧盟同期发表的论文仅是2014年的2倍，美国是2014年的2.75倍。

以下图表显示了中国(图1.1.4a)、欧盟(图1.1.4b)和美国(图1.1.4c)的企业、政府、医疗和其他机构的同行评审的人工智能出版物数量。2 2019年，中国同行评议的人工智能总体论文中，约有95.4%隶属于该学术领域，而欧盟和美国的这一比例分别为81.9%和89.6%。这些隶属类别并不相互排斥，因为一些作者可以隶属于不止一种类型的机构。数据表明，在中国和欧盟，不包括学术界，政府机构比其他类别的机构一直贡献同行评议的人工智能论文的最高比例(2019年分别为15.6%和17.2%)，而在美国，最高比例是企业附属机构(19.2%)。

自20世纪80年代以来，美国学术界和产业界之间的研发合作在重要性和普及程度上都有所增长，产业界-大学研究中心的激增以及企业对大学研究的贡献就是明证。图1.1.5显示，2015年至2019年，美国出版的学术-公司联合、合著、同行评议的人工智能论文数量最多，是欧盟的两倍多，欧盟位居第二，中国紧随其后，排名第三。

为了评估学术-企业合作如何影响来自不同地理区域的人工智能出版物的实地加权引用影响(FWCI)，见图1.1.6。FWCI将出版物被引用的数量与同一年度、学科和格式(书籍、文章、会议论文等)的其他类似出版物被引用的平均数量进行比较。1.0代表世界平均水平。根据世界平均水平，大于或小于1意味着出版物被引用的数量高于或低于预期。例如，FWCI为0.75意味着比世界平均水平少25%的引用。该图表以y轴表示所有同行评阅的人工智能出版物的FWCI，以x轴表示学术与企业合作出版的总数量(以对数尺度表示)。为了提高FWCI指标的信噪比，只有那些在2020年拥有超过1000份同行评议的人工智能出版物的国家才被包括在内。

根据微软学术图表的数据，接下来的三个部分图表显示了人工智能期刊、会议出版物和专利的出版趋势，以及它们各自的引用情况，这为研究开发的影响提供了信号。MAG 3是一个知识图谱，涵盖2.25亿多种出版物(截至2019年11月底)。

总体来看，2020年的人工智能期刊发表数量是2000年的5.4倍(图1.1.7a)。2020年，人工智能期刊发文量较2019年增加34.5%，增幅远高于2018 - 2019年(19.6%)。同样，2020年，人工智能期刊在全球所有出版物中的份额跃升了0.4个百分点，高于过去5年0.03个百分点的平均水平(图1.1.7b)。

图1.1.8显示了2000年至2020年地区期刊数据库中占主导地位的人工智能期刊的份额。东亚和太平洋,欧洲,在过去的21年里，中亚和北美地区的人工智能期刊占据了大部分的发表量，而这三个地区的领先地位也在不断变化。2020年，东亚;太平洋地区拥有最高的份额(26.7%)，其次是欧洲和欧洲;中亚(13.3%)和北美(14.0%)。此外，在过去的10年里，南亚和中东地区也出现了类似的情况。北非的增长最为显著，这两个地区的人工智能期刊发表数量分别增长了6倍和4倍。

根据地理区域图1.1.9显示，在三大人工智能大国中，自2017年以来，中国的人工智能期刊出版物在世界上的份额最大，2020年达到18.0%，其次是美国(12.3%)和欧盟(8.6%)。

从人工智能期刊的最高被引份额来看，数据1.1.10显示，中国(20.7%)在2020年首次超过美国(19.8%)，而欧盟的总被引份额继续下降。

2000年至2019年，人工智能会议出版物数量增长了四倍，尽管增长在过去10年趋于平稳，2019年的出版物数量仅比2010年高出1.09倍。

图1.1.12显示，与AI期刊出版的趋势相似，东亚和amp;太平洋,欧洲,中亚和北美是世界上主要的人工智能会议出版物来源。特别是东亚地区;太平洋航空公司从2004年开始领先，到2020年占比超过27%。北美超过了欧洲;2018年，中亚地区占20.1%，位居第二，2020年为21.7%。

从地理区域来看，2019年中国在全球人工智能会议出版物的份额超过了美国(图1.1.13)。自2000年以来，它的份额显著增长。2019年，中国人工智能会议出版物的比例几乎是2000年的9倍。欧盟会议出版物的份额在2011年达到顶峰，并继续下降。

关于人工智能会议出版物的引用，从图1.1.14可以看出，在过去的21年里，美国在主要大国中一直处于领先地位。2020年，美国以40.1%的总引用数位居榜首，其次是中国(11.8%)和欧盟(10.9%)。

人工智能的专利
概述
近20年来，全球发布的人工智能专利总数稳步增长，从2000年的21806项增长到2019年的101876项，超过4.5倍(图1.1.15a)。全球发布的人工智能专利的份额呈现较小的增长，从2000年的2%左右增长到2020年的2.9%(图1.1.15b)。人工智能专利数据不完整——2020年数据集中只有8%的数据包含国家或地区。我们有理由质疑按地区和地理区域划分的人工智能专利出版物份额数据，因此该数据没有包含在主要报告中。详见附录。

ARXIV的出版物

除了发表学术论文的传统途径(如上所述)，人工智能研究人员还采用了在在线电子预印本资源库ARXIV上发表他们的研究成果(通常是事先的同行评议)的做法。arXiv允许研究人员在向期刊和会议提交他们的发现之前分享他们的发现，这大大加快了信息发现和传播的周期。本节人工智能相关出版物的数量包括cs下关于arXiv的预印本。AI(人工智能)，cs。计算与语言，cs。计算机视觉，计算机视觉神经与进化计算，cs。RO(机器人),cs。LG(计算机科学中的机器学习)和stat.ML(统计中的机器学习)。在短短6年时间里，arXiv上与人工智能相关的出版物数量增长了6倍多，从2015年的5478篇增至2020年的34736篇(图1.1.16)。

按地区
区域分析显示，虽然北美仍在arXiV ai相关出版物的全球份额中处于领先地位，但其份额已从2017年的41.6%下降至2020年的36.3%(图1.1.17)。与此同时，东亚及太平洋地区的出版物份额在过去五年里稳步增长，从2015年的17.3%增至2020年的26.5%

通过地理区域
在三大人工智能大国中，在arXiv上的人工智能相关出版物总数不断增加，而中国正在追赶美国(图1.1.18a和图1.1.18b)。另一方面，欧洲联盟统计的出版物所占份额基本上没有变化。

按研究领域分类

在arXiv上与人工智能相关的六个研究领域中，2015 - 2020年，机器人技术(cs.RO)和计算机科学中的机器学习(cs.LG)的论文数量增长最快，分别增长了11倍和10倍(图1.1.19)。2020年,cs。LG和计算机视觉(Computer Vision, cs.CV)在arXiv上发表的人工智能相关文章数量最多，分别占32.0%和31.7%。2019年至2020年，在这7个研究类别中，增长最快的类别是计算和语言(cs. cl)，增长35.4%;罗依,35.8%。
在arXiv上与人工智能相关的六个研究领域中，机器人技术(cs. ro)和计算机科学中的机器学习(cs。LG (LG)在2015年至2020年期间增长最快，分别增长了11倍和10倍。

关于arXiv的深度学习论文

随着数据访问的增加和计算能力的显著提高，深度学习(DL)领域正以惊人的速度发展。来自Nesta的研究人员使用了一种主题建模算法，通过分析计算机科学(CS)和统计中的机器学习(state.ML)类别下的arXiv论文摘要，识别出关于arXiv的深度学习论文。图1.1.20表明，仅在过去5年里，DL关于arXiv的出版总量就增长了近6倍。

1.2会议

去年，参加人工智能会议的人数显著增加，因为大多数会议都是通过虚拟形式举行的。只有第34届人工智能发展协会(AAAI)人工智能会议是在2020年2月亲自召开的。会议组织者报告说，虚拟形式允许来自世界各地的更高的研究人员出席，尽管精确的出席人数很难测量。

由于2020年会议出席数据的非典型性质，根据2019年的出席数据，2019年的11个主要人工智能会议被分为两类:超过3000人参加的大型人工智能会议和少于3000人参加的小型人工智能会议。图1.2.1显示，2020年，9个会议的出席人数几乎翻了一番。特别是，国际智能机器人和系统会议(IROS)延长了虚拟会议，允许用户观看活动长达3个月，这解释了高出席人数的原因。因为国际人工智能联合会议(IJCAI)是在2019年和2021年1月举行的，而不是在2020年，所以它没有出现在图表上。

会议组织者报告说，虚拟形式允许来自世界各地的更高的研究人员出席，尽管精确的出席人数很难测量

如何引用这份报告

Daniel Zhang, Saurabh Mishra, Erik Brynjolfsson, John Etchemendy, Deep Ganguli, Barbara Grosz, Terah Lyons, James Manyika, Juan Carlos Niebles, Michael Sellitto, Yoav Shoham, Jack Clark, and Raymond Perrault, The AI Index 2021 Annual Report, AI Index Steering Committee, Human-Centered AI Institute, Stanford University, Stanford, CA, March 2021.