机器学习与自然语言处理的进步有助于简化论文检索过程。 Sparrho最近发布了一个搜索平台,通过动态馈送和专家管理公告栏,帮助研究者了解各科学领域的最新出版物。Sparrho利用人工智能结合人类智慧,对于如何从4.5万多种学术期刊中检索论文提出个性化建议。今年年初,Sparrho通过创立的“早期职业生涯研究员奖”,开始向博士生和博士后研究者提供500英镑的差旅补助。近期获奖者已出现在墨西哥、日本和德国。
我们有幸采访到Sparrho的CEO兼联合创始人Vivian Chan博士。
Sparrho与其他搜索引擎相比有何不同之处?它为研究者提供的主要优点是什么?
Sparrho鼓励专家用户在自己的公共收藏夹(公告栏)中管理研究论文,并写上简短摘要,说明这些论文为何归在一起。这项新体验利用人类的独有能力,将不同领域的研究以出乎意料的方式联系起来。结果就产生了一种新方法,让专家和新手可以探讨文献,直接听取研究者的观点。
你可以分享一些与Sparrho有关的重要统计数据吗?这样可以让我们的读者从中受益。
目前,我们已将网上的4.5万多种学术期刊及其他预印本服务器和资源中的6千多万篇论文和专利编入索引。另外,我们每月有35万名来自全球各地的活跃用户,这一数字还在继续增长!
在你看来,技术正在如何改变学术出版业的前景?它所面临的挑战又有哪些?
互联网让内容传播变得即时、低价。不过,现在有了更多的可用信息和不断增加的多学科学术研究方法,问题就变成了检索论文犹如大海捞针。从某种程度上说,随着电子出版形式和电子数据库的出现,以及学术界、出版业和技术社区的创新人士共同努力打造日益复杂的工具(根据荷兰乌特勒支大学图书管理员Bianca Kramer和 Jeroen Bosman进行的一项研究,共有400多种工具),学术自20世纪90年来以来已经遭到破坏。
不过,最大的飞跃之一是自动检索的发展和精益求精的搜索算法,这一组合推动了2004年发布的谷歌学术搜索(Google Scholar)向前发展。目前,走在最前沿的是如何大规模利用人类智慧,并将其与机器学习算法相结合,以提高电脑生成建议的准确性。我们知道的一个前提是现有文献是我们训练推荐算法的最大、也最丰富的数据集。然而,从历史上看,人们对于学术兴趣更加浓厚的领域和人群仍然存有偏见。