唐杰:做学术要像爷们一样“顶天立地”
编者按:唐杰,CCF高级会员,清华大学副教授,主要研究方向为社会网络分析和数据挖掘。他曾潜心寂寞一年与团队做出网络挖掘与搜索系统ArnetMiner,在学术界得到了广泛的应用,吸引近210个国家与地区总计298万个独立IP的访问量。如今,身为副教授的他,以身作则告诉他的学生,做研究就要像个爷们那样“顶天立地”。
唐杰,清华大学计算机系副教授
“最痛苦”的阶段
方展鹏今年研三。在他的记忆里,研究生低年级时是他“最痛苦”的阶段。
那时每次交给导师唐杰的项目论文,都会被改得“面目全非”地回到自己手中,甚至有时还会完全被“重写”,尤其是一篇有关腾讯公司用户支付行为的分析的文章,除了几个段落得到保留之外,其它段落“在导师的刀下无一能够幸免”。
方展鹏本科二年级时就开始参与唐杰的科研项目。大四决定保研清华后,在选择研究生导师时,考虑到唐杰在计算系里科研“做的出名”而且多数跟他的学生出国都能“申请到很好的学校,尤其是不少毕业生都能申请到MIT(美国麻省理工学院)”。他坚持了自己本科时期的选择。
唐杰,清华大学计算机科学与技术系副教授兼任科研办公室主任,其研究领域社会网络挖掘,社会影响力分析,异构网络中的机器学习,数据挖掘以及语义Web。
“简单来说,目前唐老师的实验室主要做的是数据挖掘以及机器学习。”方展鹏提到唐杰的一个研究就是通过社交网络分析的框架来预测微信朋友圈中人与人之间的交往类型、亲密度以及关系未来走向的预测。
方展鹏也不例外。
从研究生一年级开始,他被唐杰安排负责腾讯公司的一个项目,主要是通过分析《地下城与勇士》中玩家的社会网络关系来预测用户的支付行为。“通过运用社交网络分析的框架,我们会发现,如果一个玩家的好友圈中愿意付钱玩游戏居多数的话,那么他在游戏中发生的支付行为可能性就比一般的玩家要大。”根据理论分析的结果,方展鹏也通过腾讯公司的平台对用户进行针对性地广告投放。这样的实践活动让他得以将理论与现实进行结合,研究的层次也更为丰富。
在方展鹏看来,唐杰是一个“聪明”,“富有智慧”的人。在他所负责的腾讯公司的项目中,唐杰给他提了不少启发性的“点子”。比如在研究研究社交网络形成时,唐杰就曾创造性地提出是否可以通过社交网络形成的规模逆向推断其形成的时间。方展鹏也提起自己参与的项目:“在《地下城与勇士》这款游戏由不同玩家组成的社交网络中,我原本运用传统的理论去套,但是却收效不明显,后来唐老师提出,游戏中的社交网络并非传统的社交网络,而是根据动态事件的交互性生成的网络,这就启发我要打破静态性的研究思路。”
用‘咖啡’的精神,做“顶天立地”的研究
唐杰受聘为安徽大学讲席教授
“研究要顶天立地。”提及唐杰给他带来的改变,他不假思索地就脱口而出这句话。“唐老师说,顶天就是要有先进的理念,立地是注重把研究成果应用到现实系统中。”
唐杰曾撰写过一篇题为《用“咖啡”的精神做学问》的文章。他用一个事例具体解释了自己“顶天立地”的研究理念。为了将社会网络理论和数据挖掘算法在学术研究者网络载体上得到应用,唐杰带着实验室的几个师弟师妹,经过一年“几乎没有发表任何文章,全身心地投入到系统设计和功能实现上”的努力,终于研发出网络挖掘与搜索系统ArnetMiner。
迄今为止,这个系统收集了175万名研究者信息、400多万篇论文信息、5400多万条引用关系和8000多个会议信息,并在学术界得到了广泛的应用,吸引近210个国家与地区总计298万个独立IP的访问量。
“系统研发是需要耐得住寂寞的。”唐杰记得自己在香港科技大学做短期访问期间,遇到一位教授,想到自己那时咖啡喝得太多,他不住感叹一句:“这几天咖啡喝得太多,感觉有点儿上瘾,需要戒一戒了。”那位教授回说,“为什么要戒呢?上瘾也不一定是坏事呀。如果我们做研究能像喝咖啡一样上瘾,又何愁研究走不好呢?”唐杰听了他的话深受启发。“是啊,‘上瘾’便是人生的精彩所在,无论是研究,还是其它事,只要专注、努力,就一定能做好。” 后来唐杰把这个归纳为“咖啡精神”。
唐杰与其团队制作的Arnetminer网站
虽然望着“面目全非”的论文,方展鹏心里会有些难过,但是他也深晓,“自己处于初学阶段,本来就什么都不会”,“唐老师的这种方式就是为了更快地帮助他成长”。
杨洋于2011年考取清华大学计算机系的博士,是唐杰任教以来的首届博士。相比方展鹏在研究生低年级遭遇到的“痛苦”,杨洋在博一年级虽然是首次与唐杰接触,但是在科研上拥有更多“选择的自由”。
杨洋博士一年级就被导师唐杰“送去”美国康奈尔大学访学。在博二返校时,他心想,“自己在国外经历一年真正的学术修炼,这次回来时候好好做一次真正的研究了”。唐杰听了他的这个想法,结合他在社会网络中的信息传播的研究志趣,把他推荐给了一位在美国伊利诺伊大学香槟分校深造,杨洋的同门师姐。两人在研究的想法上一拍即合,并正式建立合作关系。然而,这篇研究成果的论文却经过两年的酝酿才正式出炉。
敲完论文的最后一字,杨洋以邮件的形式发送给国外与他合作的教授。在给唐杰过阅时,却被指出,“我把我的论文递交了”应改为“我们的论文”。“唐老师告诉我说,虽然我和我们只有一个字的差别,但是这个细节却能体现出我对这种合作关系的重视。”在杨洋的记忆里,唐杰对他学术上的引导基本都是实际行动的引导,很少通过“讲”的形式。
唯一的例外。杨洋从博士一年级起就开始向本学科的核心期刊投论文,但是结果却“疯狂被拒”,直到第五篇被拒时,他忍不住向导师倾诉。唐杰只回答了他一句话,“没有因为几篇论文被拒与否带来的所谓痛苦不痛苦,你要有出于对你自己工作的自信。”
“战友”与“严父”
唐杰与学生打篮球
除却“研究要顶天立地”那句话,唐杰直博三年级的学生张宇韬还记得唐杰老师常跟他说,“Work hard,play harder,只有玩痛快了,干活才能高效。”在他的眼里,唐杰的工作刻苦早在“坊间广为流传”。“但是我们看到的不仅是唐杰大年三十晚上通宵帮我们润色论文,或是11点还在实验室讨论项目进展,还有跟我们一起在球场上挥洒汗水,以及在桌游吧里的足智多谋。”张宇韬说,“对于我们而言,唐老师更像是与我们共同奋战在科研的第一线的战友。”
方展鹏今年研究生三年级,马上面临毕业。经过三年的研究生阶段,他发现自己并不适合从事学术,更喜欢应用层面的工作。但这种发现也源自唐杰针对他的特质进行地指导。
“唐老师是一个会尊重每一个学生本身的特质的人,我有一个同门师兄,一直都有创业的想法, 唐老师就不会给他特别大的科研压力,给他足够自由发展的空间,现在这位师兄创立的Faceplusplus公司已经融资4500万美金。”方展鹏记得唐杰曾跟学生说,“你的人生自己把握,我只能尽力帮扶。”
博士阶段与唐杰朝夕相处五年,对杨洋来说,导师就像“自己的家里人一般熟悉”。但是他却并不是“慈母”,而是一位“严父”。唐杰总是会给自己还有学生安排一条“极其紧凑的工作线”,“他是一个要求苛刻,近乎完美的人,有时说你时语气还会很重。”
但是博一后期,杨洋却突然发现导师虽然对他的要求依然严格,但说话的方式却忽然柔和许多,经过打听一知,原来从那会儿起,“工作狂”唐杰终于做爸爸了。