Paper Pal:一个中英文论文及其代码大数据搜索平台

点击上方蓝字关注我们

Paper Pal:一个中英文论文及其代码大数据搜索平台

余万, 付聿炜, 熊贇, 朱扬勇

1 引言

在开展科研工作的过程中,科研人员需要从大量实时更新的论文中持续地跟踪学术界前沿的发展情况,学习最新研究成果。近年来,人工智能(artificial intelligence, AI)、数据挖掘等领域受到的关注度不断增加,相关会议的论文数量呈爆发式增长。图1显示了arXiv数据库中2010—2019年AI领域的论文增长情况。但是,巨大的论文数量导致科研人员搜索论文的过程中耗费了大量的时间。

图1   2010—2019年arXiv数据库中AI领域的论文增长情况

目前,已经有很多论文搜索引擎,如Microsoft Academic、Arxiv Sanity Preserver、Papers With Code以及AMiner等。其中,Microsoft Academic根据研究领域对论文进行了分类,并提供了论文的全文链接、所发表的会议或期刊、引用的参考文献等;Arxiv Sanity Preserver提供了arXiv上论文的浏览、搜索和排序功能,并根据用户收藏的论文,使用TF-IDF和支持向量机(support vector machine,SVM)实现论文推荐。对于计算机领域的科研人员,论文中提出的算法、模型的代码是相当重要的学习资源,能够让人更直观、快速地理解和掌握一个新算法或新模型,但Microsoft Academic和Arxiv Sanity Preserver等未提供代码信息。在众多代码平台中, GitHub成为目前非常有代表性的代码平台。但是,在搜索论文和对应的代码时,科研人员需要在不同的搜索平台上来回切换以获取论文和代码,这无疑增加了科研工作的时间。

为了解决论文和论文代码在空间上的差异问题,Atlas ML推出一个免费、开源的机器学习领域的论文和代码分享平台——Papers With Code,该平台不提供计算机领域的中文论文。AMiner是目前功能较全的研究者、论文搜索平台,其构建的主要目标是通过整合多源数据提供研究者搜索分析功能来构建研究者网络和学术论文网络。该平台也提供中英文论文的搜索功能,并包含部分可人工编辑的论文相应的代码链接。

不同于AMiner平台的构建目标,本文聚焦中国计算机领域的科研人员在搜索论文中的实际需求,以“中国计算机学会(China Computer Federation,CCF)推荐分区论文+代码+中文期刊+推荐”为定位,设计和实现了一个使用友好、免费、开源的计算机领域论文与代码搜索系统——Paper Pal。

Paper Pal针对中国计算机领域的科研人员需求,按照CCF推荐论文分区对平台中的论文进行分类,提供方便的选项卡和搜索支持,平台功能更加聚焦。目前&

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值