机器学习(Machine Learning)入门科普

=======================国外====================

Machine Learning 大家(1):M. I. Jordan (http://www.cs.berkeley.edu/~jordan/) 

   在我的眼里,M Jordan无疑是武林中的泰山北斗。他师出MIT,现在在berkeley坐镇一方 
,在附近的两所名校(加stanford)中都可以说无出其右者,stanford的Daphne Koller虽 
然也声名遐迩,但是和Jordan比还是有一段距离。 

   Jordan身兼stat和cs两个系的教授,从他身上可以看出Stat和ML的融合。 

   Jordan最先专注于mixtures of experts,并迅速奠定了自己的地位,我们哈尔滨工业大 
学的校友徐雷跟他做博后期间,也在这个方向上沾光不少。Jordan和他的弟子在很多方面作 
出了开创性的成果,如spectral clustering, Graphical model和nonparametric Bayesi 
an。现在后两者在ML领域是非常炙手可热的两个方向,可以说很大程度上是Jordan的lab一 
手推动的。 

   更难能可贵的是,Jordan不仅自己武艺高强,并且揽钱有法,教育有方,手下门徒众多 
且很多人成了大器,隐然成为江湖大帮派。他的弟子中有10多人任教授,个人认为他现在的 
弟子中最出色的是stanford的Andrew Ng,不过由于资历原因,现在还是assistant profes 
sor,不过成为大教授指日可待;另外Tommi Jaakkola和David Blei也非常厉害,其中Tomm 
i Jaakkola在mit任教而David Blei在cmu做博后,数次获得NIPS最佳论文奖,把SVM的最大 
间隔方法和Markov network的structure结构结合起来,赫赫有名。还有一个博后是来自于 
toronto的Yee Whye Teh,非常不错,有幸跟他打过几次交道,人非常nice。另外还有一个 
博后居然在做生物信息方面的东西,看来jordan在这方面也捞了钱。这方面他有一个中国学 
生Eric P. Xing(清华大学校友),现在在cmu做assistant professor。 

   总的说来,我觉得Jordan现在做的主要还是graphical model和Bayesian learning,他 
去年写了一本关于graphical model的书,今年由mit press出版,应该是这个领域里程碑式 
的著作。3月份曾经有人答应给我一本打印本看看,因为Jordan不让他传播电子版,但后来 
好像没放在心上(可见美国人也不是很守信的),人不熟我也不好意思问着要,可以说是一 
大遗憾. 另外发现一个有趣的现象就是Jordan对hierarchical情有独钟,相当多的文章都是 
关于hierarchical的,所以能hierarchical大家赶快hierarchical,否则就让他给抢了。 

   用我朋友话说看jordan牛不牛,看他主页下面的Past students and postdocs就知道了 
 

Machine Learning大家(2):D. Koller (http://ai.stanford.edu/~koller/) 

   D. Koller是1999年美国青年科学家总统奖(PECASE)得主,IJCAI 2001 Computers and 
Thought Award(IJCAI计算机与思维奖,这是国际人工智能界35岁以下青年学者的最高奖)得 
主,2004 World Technology Award得主。 

   最先知道D koller是因为她得了一个大奖,2001年IJCAI计算机与思维奖。Koller因她在 
概率推理的理论和实践、机器学习、计算博弈论等领域的重要贡献,成为继Terry Winogra 
d、David Marr、Tom Mitchell、Rodney Brooks等人之后的第18位获奖者。说起这个奖挺有 
意思的,IJCAI终身成就奖(IJCAI Award for Research Excellence),是国际人工智能界 
的最高荣誉; IJCAI计算机与思维奖是国际人工智能界35岁以下青年学者的最高荣誉。早期 
AI研究将推理置于至高无上的地位; 但是1991年牛人Rodney Brooks对推理全面否定,指出 
机器只能独立学习而得到了IJCAI计算机与思维奖; 但是koller却因提出了Probabilistic 
Relational Models 而证明机器可以推理论知而又得到了这个奖,可见世事无绝对,科学有 
轮回。 

   D koller的Probabilistic Relational Models在nips和icml等各种牛会上活跃了相当长 
的一段时间,并且至少在实验室里证明了它在信息搜索上的价值,这也导致了她的很多学生 
进入了google。虽然进入google可能没有在牛校当faculty名声响亮,但要知道google的很 
多员工现在可都是百万富翁,在全美大肆买房买车的主。 

   Koller的研究主要都集中在probabilistic graphical model,如Bayesian网络,但这玩 
意我没有接触过,我只看过几篇他们的markov network的文章,但看了也就看了,一点想法 
都没有,这滩水有点深,不是我这种非科班出身的能趟的,并且感觉难以应用到我现在这个 
领域中。 

   Koller才从教10年,所以学生还没有涌现出太多的牛人,这也是她不能跟Jordan比拟的 
地方,并且由于在stanford的关系,很多学生直接去硅谷赚大钱去了,而没有在学术界开江 
湖大帮派的影响,但在stanford这可能太难以办到,因为金钱的诱惑实在太大了。不过Kol 
ler的一个学生我非常崇拜,叫Ben Taskar,就是我在(1)中所提到的Jordan的博后,是好 
几个牛会的最佳论文奖,他把SVM的最大间隔方法和Markov network结合起来,可以说是对 
structure data处理的一种标准工具也把最大间隔方法带入了一个新的热潮,近几年很多 
牛会都有这样的workshop。 我最开始上Ben Taskar的在stanford的个人网页时,正赶上他 
刚毕业,他的顶上有这么一句话:流言变成了现实,我终于毕业了! 可见Koller是很变态 
的,把自己的学生关得这么郁闷,这恐怕也是大多数女faculty的通病吧,并且估计还非常 
的push! 

Machine learning 大家(3): J. D. Lafferty 

   大家都知道NIPS和ICML向来都是由大大小小的山头所割据,而John Lafferty无疑是里面 
相当高的一座高山,这一点可从他的publication list里的NIPS和ICML数目得到明证。虽然 
江湖传说计算机重镇CMU现在在走向衰落,但这无碍Lafferty拥有越来越大的影响力,翻开 
AI兵器谱排名第一的journal of machine learning research的很多文章,我们都能发现a 
uthor或者editor中赫然有Lafferty的名字。 

   Lafferty给人留下的最大的印象似乎是他2001年的conditional random fields,这篇文 
章后来被疯狂引用,广泛地应用在语言和图像处理,并随之出现了很多的变体,如Kumar的 
discriminative random fields等。虽然大家都知道discriminative learning好,但很久 
没有找到好的discriminative方法去处理这些具有丰富的contextual inxxxxation的数据, 
直到Lafferty的出现。 

   而现在Lafferty做的东西好像很杂,semi-supervised learning, kernel learning, 
graphical models甚至manifold learning都有涉及,可能就是像武侠里一样只要学会了九 
阳神功,那么其它的武功就可以一窥而知其精髓了。这里面我最喜欢的是semi-supervise 
d learning,因为随着要处理的数据越来越多,进行全部label过于困难,而完全unsuperv 
ised的方法又让人不太放心,在这种情况下semi-supervised learning就成了最好的。这 
没有一个比较清晰的认识,不过这也给了江湖后辈成名的可乘之机。到现在为止,我觉得c 
mu的semi-supervised是做得最好的,以前是KAMAL NIGAM做了开创性的工作,而现在Laff 
erty和他的弟子作出了很多总结和创新。 

   Lafferty的弟子好像不是很多,并且好像都不是很有名。不过今年毕业了一个中国人, 
Xiaojin Zhu(上海交通大学校友),就是做semi-supervised的那个人,现在在wisconsin- 
madison做assistant professor。他做了迄今为止最全面的Semi-supervised learning li 
terature survey, 大家可以从他的个人主页中找到。这人看着很憨厚,估计是很好的陶瓷 
对象。另外我在(1)中所说的Jordan的牛弟子D Blei今年也投奔Lafferty做博后,就足见 
Lafferty的牛了。 

   Lafferty做NLP是很好的,著名的Link Grammar Parser还有很多别的应用。其中langua 
ge model在IR中应用,这方面他的另一个中国学生ChengXiang Zhai(南京大学校友,2004年 
美国青年科学家总统奖(PECASE)得主),现在在uiuc做assistant professor。 

Machine learning 大家(4): Peter L. Bartlett 

   鄙人浅薄之见,Jordan比起同在berkeley的Peter Bartlett还是要差一个层次。Bartle 
tt主要的成就都是在learning theory方面,也就是ML最本质的东西。他的几篇开创性理论 
分析的论文,当然还有他的书Neural Network Learning: Theoretical Foundations。 

   UC Berkeley的统

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值