论文阅读-HybridCite: A Hybrid Model for Context-Aware Citation Recommendation

论文链接:https://arxiv.org/pdf/2002.06406v2.pdf

代码链接:https://github.com/ashwath92/HybridCite

摘要:引文推荐系统旨在为一篇完整的论文或一小部分被称为引文上下文的文本推荐引文。为引文上下文推荐引文的过程被称为局部引文推荐,这是本文的重点。首先,我们开发了基于嵌入、主题建模和信息检索技术的引文推荐方法。就我们所知,我们第一次将表现最好的算法结合到一个半遗传混合的引文推荐系统中。我们基于Microsoft Academic Graph (MAG)和MAG结合arXiv和ACL等数据集,离线评估了单一方法和混合方法。我们进一步开展用户研究,以评估我们的在线方法。我们的评估结果表明,包含嵌入和基于信息检索组件的混合模型比其单个组件和进一步的算法有很大的优势。

关键词:推荐系统;机器学习;数字图书馆

1 引言

       引文是学术研究论文的命脉。它们提供了一种可信度的衡量方法,既可以用来支持作者先前的研究,也可以用来改进现有的方法,甚至可以用来批评以前的研究。

        然而,近年来,由于新科学出版物的数量呈陡峭的上升曲线(详细统计见[24]),研究人员寻找合适的论文参考和引用的任务比以往任何时候都更具挑战性。因此,越来越多的研究现在被投入到引文中——基于文本中的一篇文章发现和推荐之前的工作的过程。这个文本段落,通常被称为引文上下文,可以有不同的长度,从一个短语或句子到整个文档。

        关于全局推荐的工作,即对整个论文的引用,已经由[30],[38]和[34]进行,最近由[1],[40]和[6]进行。然而,本文侧重于局部引文推荐,使用1-3句或50-100个单词的相对较小的引文上下文作为推荐输入。这种类型的细粒度推荐,有时也被称为当代研究论文中的上下文感知引用推荐,首次在[16]和[15]中探索。

        以前的作品还包括个性化的方法,如[9]和[40],它们使用作者和地点元数据作为输入,通常在评估中获得更好的分数。然而&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值