如何搜索同时引用了两篇特定文章的论文?

在科研中,有时看到两个研究类似问题的工作,会希望看看是否有后续工作对二者进行了比较和评价。比如,我听说XLNetRoBERTa是两个很牛的预训练模型,但不知道他们孰强孰弱。那我们就想找找同时引用了它们的论文,看看别人是怎么评价比较他们的?然而,Google Scholar这类的流行的搜索引擎并不直接提供找到同时引用了两篇特定文章A,B的论文,这样的搜索功能,那么我们怎么实现这一点呢?

StackExchange的讨论中,高赞回答提供的解决方案是,从A的引文中,再搜索B的标题,然后看看得到的结果。因为一般来说引用了B的文章里应该会包括B的标题,所以这样能够找到一些符合要求的文章。不过因为这样的搜索不是精确的,也会有一些包含了与B很像的一些关键词的文章混入,总体来说不是很精确。

还有另一种方法,我们可以得到A和B各自的引文,然后再取交集。如果两篇文章的引文不多,那么我们人工比较也就能够很快确定目标了。但是如果两篇文章的引文很多,那么就需要人工整理和比较,工作量非常大。

作为一个程序员,这样大批量的问题,当然不能自己手工去做啦,我们可以编程自动解决这个问题。

这里我们用到一个好东西,Semantic Scholar提供的论文信息API。我们可以通过提供论文的标识,从其数据库中找到相关的信息,其中就包括引文,然后我们就可以实现上述思路了。

现在,我们就以XLNet(arXiv:1906.08237)和RoBERTa(arXiv:1907.11692)为例,找到同时引用了它们的论文:

import semanticscholar as sch
# XLNet
paper1 = sch.paper('arXiv:1906.08237', timeout=2
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值