专访：经历了时间检验的不仅是论文，还有唐杰自己 | SIGKDD 2020时间检验奖

智源社区

于 2020-08-21 17:53:32 发布

阅读量1.3k

点赞数

文章标签：数据挖掘大数据编程语言人工智能 java

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/108162788

版权

清华大学教授唐杰因其团队开发的AMiner平台获得SIGKDD 2020时间检验应用科学奖。AMiner是一个学术研究网络挖掘系统，从2006年的博士项目发展至今，已成为大规模人才咨询和技术分析的平台。唐杰强调专注和持久是成功的关键，AMiner经历了从自动抓取学者信息到提供深度挖掘服务的转变，目前正致力于成为更实用的工具和知识图谱构建引擎。

摘要由CSDN通过智能技术生成

KDD 2020即将在8月23-27日召开。而近日，SIGKDD 2020官方推特也公布了本年度的各种奖项，其中清华大学教授、智源研究院学术副院长唐杰团队获得了ACM SIGKDD 2020时间检验应用科学奖！

获奖论文为唐杰等人在SIGKDD 2008发表的论文《ArnetMiner: extraction and mining of academic social networks》。

事实上，这并不只是一篇经历时间检验的论文。ArnetMiner（或AMiner），全称Academic Research Network Miner，即“学术研究网络挖掘平台”。从2006年起，唐杰便开始了该系统的研制，当时他还是一个博士生，所有程序只是在一台台式机上运行的demo；然而历经15年的打磨，如今该平台已经是上百人维护、数十台服务器运行的大型人才咨询、技术分析、学术查询的平台，而唐杰也已经成为数据挖掘领域的领军人物。

一个人，一个项目，一辈子，做到顶天立地。

与其说是时间检验论文，不如说是时间检验唐杰。唐杰教授曾多次向笔者表示，做研究最重要的就是专注，“做一件事情，就要把这事情做深做透，而不要在意别人怎么看、怎么说”。十多年来，唐杰每天凌晨2点睡觉，绝大多数时间泡在实验室中，几无中断；领域研究热点潮涨潮落，而他，研究的中心始终是AMiner系统。时间在变，而唐杰不变。这份专注，毫不客气地说，国内少有。

唐杰，清华大学计算机科学与技术系长聘教授，计算机系副主任，智源研究院学术副院长，清华-工程院知识智能联合实验室主任，国家杰青。研究兴趣包括：社会网络分析、数据挖掘、机器学习和知识图谱。发表论文200余篇，拥有专利20余项。主持研发了研究者社会网络挖掘系统AMiner，吸引了220个国家/地区1000多万独立IP访问。

作者：智源社区贾伟

智源：恭喜获得SIGKDD 2020时间检验奖。我们注意到你在这方面的工作从2006年就已经开始了，截止到现在AMiner的研发时间差不多已经有14年了。所谓十年磨一剑，如今你已经将这个平台产业化。我们想借着这样一个机会了解一下Aminer这个平台的发展历程。首先，能不能介绍一下AMiner是什么？

唐杰：AMiner原本的名字叫ArnetMiner，因为我是做数据挖掘的，我们这个领域有位资深的教授，叫韩家炜，他比较喜欢用Miner这个词，当时我刚加入到数据挖掘这个领域，读过他的文章后，就想做一个什么Miner，这是名字后半部分的来源。前半部是Academic Research NETwork的缩写。所以整体上的意思是“学术研究网络挖掘”。后来仍觉得太长，就直接缩写为AMiner了。

从功能上来说，我们在2006年设计时的想法就是，给一个学者名字，这个程序能够自动从互联网上把相关的信息（例如主页、照片、E-mail地址、论文等）给抓过来，并呈现出来。最开始的功能就是这么简单。当然，经过这么多年，它的功能慢慢丰富了起来，例如怎么把相同名字的人区分开来，以及把项目、专利以及其他更多信息都汇聚过来。有了这些数据，我们可以在里面做更多深度的挖掘，可以挖掘技术的脉络，然后用来服务政府、企业等。举例来说，企业要做一个新的产品研发，他可以用这种技术来挖掘这个领域里面的技术脉络，以及有哪些竞争对手等。这个时候，AMiner就变成了一个可以面向公众、面向科研界以及面向企业和政府的服务性产品。

智源：所以本质上来说，Aminer是一个基于学者数据库构建起来的信息检索和挖掘系统。那构建和检索学者数据库的原理是什么？

唐杰：最开