Google 杰出工程师谈学术搜索

"站在巨人的肩膀上" - Google 杰出工程师谈学术搜索

<script language="javascript" type="text/javascript"> uT("time114053853247883322"); </script>


前不久,Google 为中国用户推出了中文学术搜索(Google Scholar)。以下就是主导开发学术搜索的 Google “杰出工程师” (Distinguished Engineer) Anurag Acharya 在我们对他的采访中讲述他对这个产品的理念和远景想法。他原在加州大学任教,任教过程中发现了这个产品的需求。在来到 Google 以后,他便一直参与搜索技术中核心部分的研究和开发。

问:你最初是怎么想到开发 Google 学术搜索这个产品的?当时是想要让这个产品给用户带来什么好处呢?

Anurag:我当时的想法就是希望帮助全球的学者和研究人员方便的找到他们所需的信息。绝大多数研究者的成果都是建立于人类已有成就的基础上,这一点对于全球的学术研究者,尤其是那些西方世界以外的学者至关重要。我对这一点深有体会是因为我本人成长于一个印度的学术家庭。计算机技术的先驱 Vannevar Bush (万尼瓦尔.布什) 在他 1945 年《大西洋月刊》( Atlantic Monthly)的名为《我们可能这样思想》(“ As We May Think”) 的文章中讲到:“遗传学之父 孟德尔基因遗传法则在世界失传长达一个世纪之久,就是因为他的理论没有被少数有能力去延伸其理论的学者看到。这样的现象不容置疑时时刻刻出现在我们身边,很多极有价值的学术宝藏就这样在历史的不延续中失传了。”

我们不知道下一个奇迹的人类的突破点在哪里。但是,我们希望通过学术搜索帮助世界各地的研究人员去发现那些已经得出的成果,站在巨人的肩膀上,少走或不走弯路。

问:你觉得 Google 学术搜索最大的价值和特点是什么?

Anurag:学术搜索的最大价值不在于你总能看到某篇文章的全文,而是在于它把一个问题放到世界学术领域的索引中比较、检验、并过滤出最相关的文章。也就是帮你找出在该领域最相关、最有价值的文章。虽然有些文章你需要付费才能看到全部内容,但至少能通过学术搜索的“ 被引用次数”让你知道哪些文章是最有价值的,这总比一无所知好。你知道了哪些是最相关的信息,你就可以多去了解,否则你什么都做不了。通过这个全球“被引用次数”功能,研究者可以容易的找到世界范围内他的同行。我自己也曾这样通过搜索我自己的学术文章,找到我相同领域在中国的研究者。

问:你觉得中文学术搜索的重要性在哪里?

Anurag:我们发现众多中文学术期刊上发布了大量有价值学术成果。事实上,我们发布 Google 中文学术搜索之后,中文已成为索引量第二大的语种 (仅在英文之后)。

问:学术搜索当初是你的 20% 项目吗? 是不是当时越做时间花的越多,最后成了你的主要项目呢?

Anurag:长时间以来,我一直负责 Google 网页搜集和索引系统,这在搜索引擎里是很核心的技术。同时,我的另一个工作重点是确保 Google 的索引中尽可能大范围的包含学术方面的内容。开始你确实可以说这是我 20% 时间的项目。在 2004 年年中,我开始把工作重点放在改进 Google 学术内容的排序和呈现。从这个时候开始,学术搜索便成为了我的主要项目。Google 学术搜索这个产品就是于 2004 年 11 月左右完成的,也就是在我这项工作开始后的几个月。

问:后来有谁、什么时候加入到你这个项目里来?

Anurag:Alex Verstak, 学术搜索的另外一个主要工程师,在 2004 年加入。他曾经在 Google 网页搜集和索引的项目中与我合作过。当我决定专注学术搜索的时候,我问 Alex 是不是愿意同我一起做。非常幸运,他同意了。对于这个产品,我们有着同样的贡献。我们的产品经理 Adam Smith 在 2004 年晚些时候加入开始帮助我们雕琢这个产品,后来中国的产品经理黄靖新和我共同努力用了一年时间开发中文的学术搜索。我们的中国工程师朱安在 05 年中也加入了我们帮助我们解决中文学术文章中碰到的困难。

问:有没有什么关于学术搜索有趣的故事跟我们分享?

Anurag: Google 学术搜索的用户已经远远超越了学术社区的范围。事实上,最早链接到 Google 学术搜索的网站之一是一个宠狗俱乐部网站,他们利用 Google 学术搜索查找治疗狗类脊柱疾病的信息。另外,还有一对双胞胎的父母通过学术搜索查找到了治疗他们小孩一种危险的血液病的信息 [ hemoglobin "premature infant"] 
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值