清华唐杰:一个人,一个项目,一辈子

祝贺好友清华大学唐杰教授发表于SIGKDD 2008关于ArnetMiner(现为AMiner)的工作《ArnetMiner: extraction and mining of academic social networks》获得了ACM SIGKDD 2020时间检验应用科学奖(Test of。Time Applied Science Award)!

v2-4c3c5e5db277b5efae7168a06c51d3ca_b.jpg

在接受北京智源人工智能研究院的采访中,唐杰详细介绍他带领团队如何从零开始,坚持十五年打造AMiner这个平台。在我看来,这就是“科研重工业模式”的最好典范。

剖析AMiner的成功要素

这个采访非常精彩而富有启发性,多处折射出做好一个系统的不易,充满艰辛和曲折。今年我在计算所战略规划会上做的一个报告中尝试总结这类系统工作的几点规律,在唐杰的采访中都能找到印证。这里举几个例子(摘取采访中一些片段,并应对报告PPT):

v2-ed311fdeeeabb2dcc01e7e58d3846113_b.jpg

唐杰:“最大的困难就是试错,当时我们设计了很多东西,但不知道用户喜欢什么。于是当时就是,有一个功能我们就上线,如果没有用户访问,我们慢慢就把这个功能给下线了。所以我们的试错成本非常高。不过一个好处是,当时我们还是以研究为主,当有一个问题来了,我们会在上面用一些算法做研究,发现效果大大提升,就可以发paper。这样的话,至少从研究上,大家还是认可的;如果系统上用的人多,我们就把它留下了,少了我们就把它换掉。”

v2-714f29e6fa1b2f6a95db12d974a28d13_b.jpg

唐杰:“AMiner里面的每一个小点都变成了一个研究,而且都很难,做完之后他们可以去发文章,而这个功能就集成到系统当中。于是当时很多本科生都来跟我做,08~10年这几年我们系前几名的本科生基本上都在跟着我做研究、发paper。这样一下子就把系统的功能做得非常丰富。”

v2-540cb498bdb5953c53af800462eac6d3_b.jpg

唐杰:“毕业的第一年,我就给自己定了一个目标,除了在审论文外,今年不发文章。所以那年我基本上没有写论文,全部精力都在做这个系统。当时人也少,只有本科刚毕业的张静、我读研二的师弟洪铭材,就我们三个人,做了一年,基本上就上线了。

v2-17729557a15edd9293489043c00588a7_b.jpg

唐杰:“最早一个版本,其实是我用Perl写的,但Perl中有一个技术问题我一直没搞定;后来我让洪铭材帮我解决,结果他搞了几个晚上,也没搞定,一怒之下,他把整个系统用Java全部重写一遍,这是我们第一个在线运行的稳定的版本,这是很重要的一件事情。”

v2-7efe4caa2c657276672d7a146f6ab4fb_b.jpg

智源:“Google Scholar也是做学术搜索,与AMiner有很大的相似之处。那么AMiner系统和Google Scholar之间有什么区别呢?

唐杰:“AMiner与他们不同的是,我们更多的是偏研究色彩,就是把信息自动抓过来之后,通过算法来研究。我们在学者信息的自动获取上做了许多算法。我觉得这是我们最大的区别。从功能上来说,我们现在做了很多面向企业和政府的工作。这也是一个很大的差别。”

以下是采访全文:mp.weixin.qq.com/s/rqpX

题外话:

2016年前和唐杰其实没有打过交道,但从2016年之后,我们似乎一下子成了有缘之人。

  • 2016年10月举办的中国计算机大会CNCC上首次增加了由年轻人担任大会特邀报告人的思想秀,只有2个名额,需要在5月份的青年精英大会上从大约20位候选人中投票选出。最终我很荣幸和唐杰一起入选了。CNCC前夕唐杰因为有紧急的事,最后将他的10分钟都让给我,使我有机会做了一个20分钟的报告,非常感谢!
  • 2017年12月16日,CCF YOCSEF(2018-2019)换届选举完成,唐杰当选新一任主席,而我担任副主席,在一起愉快地合作了一年。

v2-93ebbd0a6bac1078cb09831e82254d3a_b.jpg
  • 唐杰十几年每天都是凌晨两点才睡觉,但他的身体素质好得惊人。我平时也运动,一开始跑步每公里配速超过6分钟,练了大约一年才好不容易跑入5分钟,最快到4分半,但也只能坚持5公里。但唐杰跑10公里的平均配速都能到4分27秒,真是铁人素质!

v2-6d2d57956b8199ac8959f5f073e7bac7_b.jpg
2018年12月5日的跑步成绩

半年前的跑步成绩:

v2-4b2c3edffc6c91869964c50202715ff6_b.jpg
2018年5月24日的跑步成绩

唐杰用了半年的时间把10公里配速从5分钟提高到了4分27秒,这背后是坚强的意志和坚持不懈的努力,也正是他追求的一种精神的体现,正如他在采访最后说道:“一定要专注,做一个事情一定要特别专注。我觉得我去做一件事情,就特别喜欢把这件事做得特别solid,特别深。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值