写在前面
想到整理这资料也是由于老师某天发邮件说让我们整理机器学习相关的文献资料这些存档,索性我就自己也全面的再整理一遍啦。方便以后查资料用~
机器学习方面的书籍就不再放了,知乎啊CSDN啊上面应该有超级多推荐的,这里我贴一个免费下载电子书的网站:BookSee。上面基本上你所能想到的但是网上暂时无法下载的书籍都可以找到。
反正想到什么资源就往上贴,框架可能不是很合理,将就看吧~
机器学习 & 深度学习
机器学习经典书籍:总结了机器学习的经典书籍,包括数学基础和算法理论的书籍,可做为入门参考书单。
Machine Learning Surveys:关于机器学习各个方向的综述
Brief History of Machine Learning:介绍了机器学习的发展历史以及大部分的算法,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.
Machine learning in 10 pictures:Deniz Yuret用10张漂亮的图来解释机器学习重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰
Best Machine Learning Resources for Getting Started:机器学习最佳入门学习资料汇总是专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门,包括编程语言、视频课程、综述论文、推荐书籍等等。
CS231n: Convolutional Neural Networks for Visual Recognition:计算机视觉经典视频,来自斯坦福的李飞飞教授
Deep Learning:深度学习方向的扛鼎之作,非常全面,值得一看
UFLDL Tutorial:Andrew Ng等整理的关于特征学习与深度学习的网站
Neural Networks and Deep Learning:Michael Nielsen著作关于神经网络与深度学习
斯坦福机器学习笔记:吴恩达的机器学习课程就不需要我多说了吧,目前有两个版本,简化版的Coursera上的Machine Learning以及难度稍微高点的cs229。这是关于该课程的学习笔记,学习的时候可供参考。
韩家炜教授在北大的《数据挖掘》暑期班视频,英文PPT,中文讲解(22集)
reddit/machine learning:reddit上的机器学习分块讨论区,有事没事可以逛逛。
UCI 机器学习数据库:UV Irvine的机器学习数据库,包含了427个常用的数据库。
Machine Learning Crash Course:谷歌最近发布的机器学习以及深度学习免费课程(基于TensorFlow)
Deep Learning - The Straight Dope:深度学习全面学习文档
TensorFlow 实现流行的机器学习算法的教程汇集:从入门到放弃的Tensorflow项目教程,非常全面。
Dive into Machine Learning:Github上的机器学习入门教程,9000stars。可见多牛
Stack overflow:世界上最大的开发者社区。
Tianchi AI learning:阿里巴巴推出的机器学习与深度学习社区,里面有挺多的课程与讲座
自然语言处理
我爱自然语言:主要是关于自然语言处理的社区,但是里面也会包括机器学习的一些讨论。
CS224n: Natural Language Processing with Deep Learning:斯坦福经典深度学习与自然语言处理课程
Michael Collins教授主页:里面有他的课程的详细介绍及链接
COMS W4705: Natural Language Processing:Collins大牛的NLP课程
GitHub项目:自然语言处理领域的相关干货整理:里面包含了大部分NLP任务实现
关于目前高校的NLP课件:哈工大刘挺老师的“统计自然语言处理”课件; 2、哈工大刘秉权老师的“自然语言处理”课件; 3、中科院计算所刘群老师的“计算语言学讲义“课件; 4、中科院自动化所宗成庆老师的“自然语言理解”课件;
http://www.stanford.edu/class/cs224n/ CS 224N / Ling 284 — Natural Language Processing
http://www.cs.berkeley.edu/~klein/cs288/sp10/ CS 288: Statistical Natural Language Processing, Spring 2010
http://demo.clab.cs.cmu.edu/fa2013-11711/index.php/Main_Page Algorithms for NLP: Basic Information (Fall 2013)
http://www.cs.colorado.edu/~martin/csci5832/lectures_and_readings.html Natural Language Processing, CSCI 5832 FALL 2013
http://www.cs.columbia.edu/~cs4705/ COMS W4705: Natural Language Processing 2013
http://www1.cs.columbia.edu/~julia/courses/CS4705/syllabus10.htm COMS 4705: Natural Language Processing, Fall 2010
http://www1.cs.columbia.edu/~julia/courses/CS4706/syllabus12.htm CS4706: Spoken Language Processing, Spring 2012
http://www.cs.cornell.edu/courses/cs4740/2014sp/ CS 4740/5740 - Introduction to Natural Language Processing, Spring 2014
http://l2r.cs.uiuc.edu/~danr/Teaching/CS546-13/ Machine Learning and Natural Language Spring 2013
http://www.cs.jhu.edu/~jason/465/ Natural Language Processing Course # 600.465 — Fall 2013
http://web.stanford.edu/class/cs224s/ CS 224S/LINGUIST 285 Spoken Language Processing
http://www.umiacs.umd.edu/~resnik/ling773_sp2014/ Ling773/CMSC773/INST728C, Spring 2014 Computational Linguistics II
http://cs.nyu.edu/courses/spring13/CSCI-GA.2590-001/index.html
http://www.cis.upenn.edu/~cis530/ CIS 530 Fall 2013 Computational Linguistics
http://pages.cs.wisc.edu/~jerryzhu/cs769.html CS 769: Advanced Natural Language Processing Spring 2010
http://pages.cs.wisc.edu/~bsnyder/cs769.html
大牛博客
七月在线创始人July,主要介绍机器学习算法这一块,通俗易懂:https://me.csdn.net/v_JULY_v
刘建平Pinard,数据挖掘,机器学习等方面算法与应用:http://www.cnblogs.com/pinard/
Ferenc Huszár,推特的机器学习工程师:https://www.inference.vc/about/
Edwin Chen's Blog:http://blog.echen.me/
实验室专辑
国内
- 清华大学
- NLP研究:孙茂松主要从事一些中文文本处理工作,比如中文文本分类,中文分词。刘知远从事关键词抽取,表示学习,知识图谱以及社会计算。刘洋从事数据驱动的机器学习。
- 情感分析:黄民烈
- 信息检索:刘奕群、马少平
- 语音识别——王东
- 社会计算:唐杰
- 哈尔滨工业大学
- 社会媒体处理:刘挺、丁效
- 情感分析:秦兵 车万翔
- 中科院
- 语言认知模型:王少楠,宗成庆
- 信息抽取:孙乐、韩先培
- 信息推荐与过滤:王斌(中科院信工所)、鲁骁(国家计算机网络应急中心)
- 自动问答:赵军、刘康,何世柱(中科院自动化研究所)
- 机器翻译:张家俊、宗成庆(中科院自动化研究所)
- 语音 合成——陶建华(中科院自动化研究所)
- 文字识别:刘成林(中科院自动化研究所)
- 文本匹配:郭嘉丰
- 北京大学
- 篇章分析:王厚峰、李素建
- 自动文摘,情感分析:万小军、姚金戈
- 语音技术:说话人识别——郑方
- 多模态信息处理:陈晓鸥
- 冯岩松
- 复旦大学
- 语言表示与深度学习:黄萱菁、邱锡鹏
- 苏州大学
- 词法与句法分析:李正华、陈文亮、张民
- 语义分析:周国栋、李军
- 机器翻译:熊德意
- 中国人民大学
- 表示学习,推荐系统:赵鑫
- 微软亚洲研究院自然语言计算组
- 周明 刘铁岩 谢幸
- 头条人工智能实验室
- 李航
- 华为诺亚
- 前任 李航 吕正东
国际
- 斯坦福大学
- 知名的NLP学者:Daniel Jurafsky, Christopher Manning, Percy Liang和Chris Potts, Richard Socher
- NLP研究:Jurafsky和科罗拉多大学波尔得分校的James Martin合著自然语言处理方面的教材。这个NLP研究组从事几乎所有能够想象到的研究方向。今天NLP领域最被广泛使用的句法分析器和词性标注工具可能都是他们负责开发的。
- [http://nlp.stanford.edu/]
- 加州大学圣巴巴拉分校
- 知名NLP学者:William Wang(王威廉), Fermin Moscoso del Prado Martin
- NLP研究:William研究方向为信息抽取和机器学习,Fermin研究方向为心理语言学和计量语言学。
- [http://www.cs.ucsb.edu/~william] William Wang(王威廉)经常在微博分享关于NLP的最近进展和趣事,几乎每条都提供高质量的信息。
- 微博:[https://www.weibo.com/u/1657470871]
- 加州大学圣迭戈分校
- 知名的NLP学者:Lawrence Saul(Roger Levy今年加入MIT)
- NLP研究:主要研究方向是机器学习,NLP相关的工作不是很多,但是在计算心理语言学有些比较有趣的工作。
- [http://grammar.ucsd.edu/cpl/]
- 加州大学圣克鲁兹分校
- 知名NLP学者:Pranav Anand, Marilyn Walker和LiseGetoor
- NLP研究:Marilyn Walker主要研究方向为对话系统。
- [http://people.ucsc.edu/~panand/]
- [http://users.soe.ucsc.edu/~maw/]
- 卡内基梅隆大学
- 知名NLP学者:Jaime Carbonell,Alon Lavie, Carolyn Rosé, Lori Levin, Roni Rosenfeld, Chris Dyer (休假中), Alan Black, Tom Mitchell以及Ed Hovy
- NLP研究:在多个NLP领域做了大量工作,包括机器翻译、文摘、交互式对话系统、语音、信息检索以及工作最为突出的机器学习领域。Chris主要方向为机器学习和机器翻译交叉研究,做了一些非常出色的工作。虽然Tom Mitchell属于机器学习系而不是语言技术研究所,但是由于他在CMU的“永不停息的语言学习者”项目中的重要贡献,我们必须在这里提到他。
- [http://www.cs.cmu.edu/~nasmith/nlp-cl.html]
- [http://www.lti.cs.cmu.edu/]
- 芝加哥大学(以及芝加哥丰田科技学院TTIC)
- 知名NLP学者:John Lafferty, John Goldsmith, Karen Livescu, MichelGalley (兼职) 和Kevin Gimpel.
- NLP研究:芝加哥大学以及丰田科技学院有许多机器学习、语音以及NLP方向的研究人员。John Lafferty是一个传奇性人物,其参与原始IBM MT模型研发,同时也是CRF模型的发明人之一。Goldsmith的团队是无监督的形态归纳法(unsupervised morphology induction)的先驱。Karen主要研究方向为语音,特别是对发音方式的建模。Michel主要研究结构化预测问题,特别是统计机器翻译。Kevin在许多结构化预测问题上都做出出色工作。
- [http://ai.cs.uchicago.edu/faculty/]
- [http://www.ttic.edu/faculty.php]
- 科罗拉多大学博尔德分校
- 知名NLP学者:Jordan Boyd-Graber, Martha Palmer, James Martin,Mans Hulden以及Michael Paul
- NLP研究:Martha Palmer主要研究资源标注和创建,其中代表性有FrameNet, VerbNet, OntoNotes等,此外其也在词汇语义学(Lexical semantics)做了一些工作。Jim Martin主要研究语言的向量空间模型,此外与Dan Jurafsky(以前在科罗拉多大学博尔德分校,之后去了斯坦福)合作编写语音和语言处理的著作。Hulden, Boyd-Graber和Paul最近加入科罗拉多大学博尔德分校。Hulden主要使用有穷状态机相关技术,做一些音位学(phonology)和形态学(morphology)相关工作,Boyd-Graber主要研究主题模型和机器学习在问答、机器翻译上的应用。Michael Paul主要研究机器学习在社交媒体监控(social media monitoring)上的应用。
- [http://clear.colorado.edu/start/index.php]
- 哥伦比亚大学
- 知名的NLP学者:有多位NLP领域顶级学者,Kathy McKeown, Julia Hirschberg, Michael Collins(休假中), Owen Rambow, Dave Blei, Daniel Hsu和Becky Passonneau
- NLP研究:在文摘、信息抽取以及机器翻译上面做了大量的研究。Julia团队主要在语音领域做一些研究。Michael Collins是从MIT离职后加入哥伦比亚NLP团队的,其主要研究内容为机器翻译和parsing。DaveBlei 和Daniel Hsu是机器学习领域翘楚,偶尔也会做一些语言相关的工作。
- [http://www1.cs.columbia.edu/nlp/index.cgi]
- 康纳尔大学
- NLP知名学者:Lillian Lee, Thorsten Joachims, Claire Cardie, Yoav Artzi, John Hale,David Mimno, Cristian Danescu-Niculescu-Mizil以及Mats Rooth
- NLP研究:在机器学习驱动NLP方面有许多有趣的研究。Lillian与其学生做了许多独辟蹊径的研究,如电影评论分类,情感分析等。Thorsten,支持向量机的先驱之一,SVMlight的作者。John研究内容包括计算心理语言学和认知科学。Mats研究领域包括语义学和音位学。Claire Cardie在欺诈性评论方面的研究室非常有影响的。Yoav Artzi在语义分析和情景化语言理解方面有许多重要的工作。David Mimno在机器学习和数位人文学(digital humanities)交叉研究的顶级学者。
- [http://nlp.cornell.edu/]
- 佐治亚理工学院
- 知名NLP学者:Jacob Eisenstein和Eric Gilbert
- NLP研究:Jacob在机器学习和NLP交叉领域做了一些突出性的工作,特别是无监督学习以及社交媒体领域。在MIT,他是Regina Barzilay的学生,在CMU和UIUC分别与Noah Smith、Dan Roth做博士后研究。此外,Eric Gilbert在计算社会学(computationalsocial science)上做了许多研究。这些研究经常与NLP进行交叉。
- [http://www.cc.gatech.edu/~jeisenst/]
- [http://smlv.cc.gatech.edu/]
- [http://comp.social.gatech.edu/]
- 伊利诺伊大学厄巴纳-香槟分校
- 知名的NLP学者:Dan Roth, Julia Hockenmaier, ChengXiang Zhai, Roxana Girju和Mark Hasegawa-Johnson
- NLP研究:机器学习在NLP应用,NLP在生物学上应用(BioNLP),多语言信息检索,计算社会学,语音识别
- [http://nlp.cs.illinois.edu/]
- 约翰·霍普金斯大学(JHU)
- 知名NLP学者:Jason Eisner, Sanjeev Khudanpur, David Yarowsky,Mark Dredze, Philipp Koehn以及Ben van Durme,详细情况参考链接
- NLP研究:约翰·霍普金斯有两个做NLP的研究中心,即 the Center for Language and Speech Processing (CLSP) 和the Human Language Technology Center of Excellence(HLTCOE)。他们的研究几乎涵盖所有NLP领域,其中机器学习、机器翻译、parsing和语音领域尤为突出。Fred Jelinek,语音识别领域的先驱,其于2010年9月去世,但是语音识别研究一直存在至今。在过去十年内,JHU的NLP summer research workshop产生出许多开创性的研究和工具。
- [http://web.jhu.edu/HLTCOE/People.html]
- [http://clsp.jhu.edu/]
- 马里兰大学学院市分校
- 知名的NLP学者:Philip Resnik, Hal Daumé, Marine Carpuat, Naomi Feldman
- NLP研究:和JHU一样,其NLP研究比较全面。比较大的领域包括机器翻译,机器学习,信息检索以及计算社会学。此外,还有一些团队在计算心理语言学上做一些研究工作。
- [https://wiki.umiacs.umd.edu/clip/index.php/Main_Page\]
- 马萨诸塞大学阿默斯特分校
- 知名的NLP学者:Andrew McCallum, James Allan (不是罗彻斯特大学的James Allan), Brendan O'Connor和W. Bruce Croft
- NLP研究:机器学习和信息检索方向顶尖研究机构之一。Andrew的团队在机器学习在NLP应用方面做出许多重要性的工作,例如CRF和无监督的主题模型。其与Mark Dredze写了一篇指导性文章关于“如何成为一名成功NLP/ML Phd”。 Bruce编写了搜索引擎相关著作“搜索引擎:实践中的信息检索”。James Allan是现代实用信息检索的奠基人之一。IESL实验室在信息抽取领域做了大量的研究工作。另外,其开发的MalletToolkit,是NLP领域非常有用工具包之一。
- [http://ciir.cs.umass.edu/personnel/index.html]
- [http://www.iesl.cs.umass.edu/]
- [http://people.cs.umass.edu/~brenocon/complang_at_umass/\]
- [http://mallet.cs.umass.edu/]
- 麻省理工学院
- 知名的NLP学者:Regina Barzilay, Roger Levy (2016年加入)以及Jim Glass
- NLP研究:Regina与ISI的Kevin Knight合作在文摘、语义、篇章关系以及古代文献解读做出过极其出色的工作。此外,开展许多机器学习相关的工作。另外,有一个比较大团队在语音领域做一些研究工作,Jim Glass是其中一员。
- [http://people.csail.mit.edu/regina/]
- [http://groups.csail.mit.edu/sls//sls-blue-noflash.shtml]
- 纽约大学
- 知名NLP学者:Sam Bowman, Kyunghyun Cho, Ralph Grishman
- NLP研究:Kyunghyun and Sam刚刚加入NLP团队,主要研究包括机器学习/深度学习在NLP以及计算语言学应用。与CILVR machine learning group、Facebook AI Research以及Google NYC有紧密联系。
- [https://wp.nyu.edu/ml2/]
- 北卡罗来纳大学教堂山分校
- 知名的NLP学者:Mohit Bansal, Tamara Berg, Alex Berg, Jaime Arguello
- NLP研究:Mohit于2016年加入该团队,主要研究内容包括parsing、共指消解、分类法(taxonomies)以及世界知识。其最近的工作包括多模态语义、类人语言理解(human-like language understanding)以及生成/对话。Tamara 和Alex Berg在语言和视觉领域发了许多有影响力的论文,现在研究工作主要围绕visual referring expressions和 visual madlibs。Jaime主要研究对话模型、web搜索以及信息检索。UNC语言学系还有CL方面一些研究学者,例如Katya Pertsova(计算形态学(computational morphology))以及Misha Becker(computational language acquisition)
- [http://www.cs.unc.edu/~mbansal/]
- [http://www.tamaraberg.com/]
- [http://acberg.com/]
- [https://ils.unc.edu/~jarguell/]
- 北德克萨斯大学
- 知名的NLP学者:Rodney Nielsen
- NLP研究:Rodney主要研究NLP在教育中的应用,包括自动评分、智能教学系统
- [http://www.rodneynielsen.com/]
- 东北大学
- 知名NLP学者:David A. Smith, Lu Wang, Byron Wallace
- NLP研究:David在数位人文学(digital humanities)特别是语法方面做了许多重要的工作。另外,其受google资助做一些语法分析工作,调研结构化语言(structural language)的变化。Lu Wang主要在文摘、生成以及论元挖掘(argumentation mining)、对话、计算社会学的应用以及其他交叉领域。Byron Wallace的工作包括文本挖掘、机器学习,以及它们在健康信息学上的应用。
- [http://www.northeastern.edu/nulab/]
- 纽约市立学院(CUNY)
- 知名NLP学者:Martin Chodorow和WilliamSakas
- NLP研究:Martin Chodorow,ETS顾问,设计Leacock-Chodorow WordNet相似度指标计算公式,在语料库语言学、心理语言学有一些有意义的工作。此外NLP@CUNY每个月组织一次讨论,有很多高水平的讲者。
- [http://nlpatcuny.cs.qc.cuny.edu/]
- 俄亥俄州立大学(OSU)
- 知名的NLP学者:Eric Fosler-Lussier, Michael White, William Schuler,Micha Elsner, Marie-Catherine de Marneffe, Simon Dennis, 以及Alan Ritter, Wei Xu
- NLP研究:Eric的团队研究覆盖从语音到语言模型到对话系统的各个领域。Michael主要研究内容包括自然语言生成和语音合成。William团队研究内容主要有parsing、翻译以及认知科学。Micha在Edinburgh做完博士后工作,刚刚加入OSU,主要研究内容包括parsing、篇章关系、narrative generation以及language acquisition。Simon主要做一些语言认知方面的工作。Alan主要研究NLP在社交媒体中应用和弱监督学习。Wei主要做一些社交媒体、机器学习以及自然语言生成的交叉研究。
- [http://cllt.osu.edu/]
- 宾夕法尼亚大学 -知名的NLP学者:Arvind Joshi, Ani Nenkova, Mitch Marcus, Mark Liberman和Chris Callison-Burch
- NLP研究:这里是LTAG(Lexicalized Tree Adjoining Grammar)、Penn Treebank的起源地,他们做了大量parsing的工作。Ani从事多文档摘要的工作。同时,他们也有很多机器学习方面的工作。Joshi教授获得ACL终身成就奖。
- [http://nlp.cis.upenn.edu/]
- 匹兹堡大学
- 知名的NLP学者:Rebecca Hwa, Diane Litman和Janyce Wiebe
- NLP研究:Diane Litman从事对话系统和评价学生表现方面的研究工作。Janyce Wiebe在情感/主观分析任务上有一定的影响力。
- [http://www.isp.pitt.edu/research/nlp-info-retrieval-group]
- 罗切斯特大学
- 知名的NLP学者:Len Schubert, James Allen和Dan Gildea
- NLP研究:James Allen是篇章关系和对话任务上最重要的学者之一,他的许多学生在这些领域都很成功,如在AT&T实验室工作的Amanda Stent,在南加州大学资讯科学研究院USC/ISI的David Traum。Len Schubert是计算语义学领域的重要学者,他的许多学生是自然语言处理领域内的重要人物,如在Hopkins(约翰•霍普金斯大学)的Ben Van Durme。Dan在机器学习、机器翻译和parsing的交叉研究上有一些有趣的工作。
- [http://www.cs.rochester.edu/~james/]
- [http://www.cs.rochester.edu/~gildea/] -[http://www.cs.rochester.edu/~schubert/]
- 罗 格斯大学
- 知名的NLP学者:Nina Wacholder和Matthew Stone
- NLP研究:Smaranda和Nina隶属通讯与信息学院(School of Communication and Information)的SALTS(Laboratory for the Study of Applied Language Technology and Society)实验室。他们不属于计算机专业。Smaranda主要做自然语言处理方面的工作,包括机器翻译、信息抽取和语义学。Nina虽然之前从事计算语义学研究,但是目前更专注于认知方向的研究。Matt Stone是计算机专业的,从事形式语义(formal semantics)和多模态交流(multimodal communication)的研究。
- [http://salts.rutgers.edu/]
- [http://www.cs.rutgers.edu/~mdstone/]
- 南加州大学
- 知名的NLP学者:信息科学学院有许多优秀的自然语言处理专家,如Kevin Knight, Daniel Marcu, Jerry Hobbs和 Zornitsa Kozareva
- NLP研究:他们从事几乎所有可能的自然语言处理研究方向。其中主要的领域包括机器翻译、文本解密(decipherment)和信息抽取。Jerry主要从事篇章关系和对话任务的研究工作。Zornitsa从事关系挖掘和信息抽取的研究工作。
- [http://nlg.isi.edu/]
- 加州大学伯克利分校
- 知名的NLP学者:Dan Klein, Marti Hearst, David Bamman
- NLP研究:可能是做NLP和机器学习交叉研究的最好研究机构之一。Dan培养了许多优秀学生,如Aria Haghighi, John DeNero和Percy Liang。
- [http://nlp.cs.berkeley.edu/Members.shtml]
- 德克萨斯大学奥斯汀分校
- 知名的NLP学者:Ray Mooney, Katrin Erk, Jason Baldridge和Matt Lease
- NLP研究:Ray是自然语言处理与人工智能领域公认的资深教授。他广泛的研究方向包括但不限于机器学习、认知科学、信息抽取和逻辑。他仍然活跃于研究领域并且指导很多学生在非常好的期刊或者会议上发表文章。Katrin 专注于计算语言学的研究并且也是该领域著名研究者之一。Jason从事非常酷的研究,和半监督学习、parsing和篇章关系的交叉领域相关。Matt研究信息检索的多个方面,最近主要发表了许多在信息检索任务上使用众包技术的论文。
- [http://www.utcompling.com/]
- [http://www.cs.utexas.edu/~ml/]
- 华盛顿大学
- 知名的NLP学者:Mari Ostendorf, Jeff Bilmes, Katrin Kirchoff, Luke Zettlemoyer, Gina Ann Levow, Emily Bender, Noah Smith, Yejin Choi和 Fei Xia
- NLP研究:他们的研究主要偏向于语音和parsing,但是他们也有通用机器学习的相关工作。他们最近开始研究机器翻译。Fei从事机器翻译、parsing、语言学和bio-NLP这些广泛的研究工作。Emily从事语言学和自然语言处理的交叉研究工作,并且负责著名的计算语言学相关的专业硕士项目。Gina从事对话、语音和信息检索方向的工作。学院正在扩大规模,引入了曾在卡内基梅隆大学担任教职的Noah和曾在纽约州立大学石溪分校担任教职的Yejin。
- [https://www.cs.washington.edu/research/nlp]
- [https://ssli.ee.washington.edu/]
- [http://turing.cs.washington.edu/]
- [http://depts.washington.edu/lingweb/]
- 威斯康辛大学麦迪逊分校
- 知名的NLP学者:Jerry Zhu
- NLP研究:Jerry更加偏向机器学习方面的研究,他主要从事半监督学习的研究工作。但是,最近也在社交媒体分析方向发表论文。
- [http://pages.cs.wisc.edu/~jerryzhu/publications.html]
- 剑桥大学
- 知名的NLP学者:Stephen Clark, Simone Teufel, Bill Byrne和Anna Korhonen
- NLP研究:有很多基于parsing和信息检索的工作。最近,也在其他领域发表了一些论文。Bill是语音和机器翻译领域非常知名的学者。
- [http://www.cl.cam.ac.uk/research/nl/]
- 爱丁堡大学
- 知名的NLP学者:Mirella Lapata, Mark Steedman, Miles Osborne, Steve Renals, Bonnie Webber, Ewan Klein, Charles Sutton, Adam Lopez和Shay Cohen
- NLP研究:他们在几乎所有的领域都有研究,但我最熟悉的工作是他们在统计机器翻译和基于机器学习方法的篇章连贯性方面的研究。
- [http://www.ilcc.inf.ed.ac.uk/]
- 新加坡国立大学
- 知名的NLP学者:Hwee Tou Ng
- NLP研究:Hwee Tou的组主要从事机器翻译(自动评价翻译质量是焦点之一)和语法纠错(grammatical error correction)方面的研究。他们也发表了一些词义消歧和自然语言生成方面的工作。Preslav Nakov曾是这里的博士后,但现在去了卡塔尔。
- [http://www.comp.nus.edu.sg/~nlp/home.html]
- 牛津大学
- 知名的NLP学者:Stephen Pulman和Phil Blunsom
- NLP研究:Stephen在第二语言学习(second language learning)和语用学方面做了许多工作。Phil很可能是机器学习和机器翻译交叉研究领域的领导者之一。
- [http://www.clg.ox.ac.uk/people.html]
- 亚琛工业大学
- 知名的NLP学者:Hermann Ney
- NLP研究:Aachen是世界上研究语音识别和机器翻译最好的地方之一。任何时候,都有10-15名博士生在Hermann Ney的指导下工作。一些统计机器翻译最厉害的人来自Aachen,如Franz Och(Google Translate负责人),Richard Zens(目前在Google)和Nicola Ueffing(目前在NRC国家研究委员会,加拿大)。除了通常的语音和机器翻译的研究,他们同时在翻译和识别手语(sign language)方面有一些有趣的工作。但是,在其他NLP领域没有许多相关的研究。
- [http://www-i6.informatik.rwth-aachen.de/web/Homepage/index.html]
- 谢菲尔德大学
- 知名的NLP学者:Trevor Cohn, Lucia Specia, Mark Stevenson和Yorick Wilks
- NLP研究:Trevor从事机器学习与自然语言处理交叉领域的研究工作,主要关注图模型和贝叶斯推理(Bayesian inference)。Lucia是机器翻译领域的知名学者并在这个领域组织(或共同组织)了多个shared tasks和workshops。Mark的组从事计算语义学和信息抽取与检索的研究工作。Yorick获得ACL终身成就奖,并在大量的领域从事研究工作。最近,他研究语用学和信息抽取。
- [http://nlp.shef.ac.uk/]
- 达姆施塔特工业大学, The Ubiquitous Knowledge Processing实验室
- 知名的NLP学者:Irena Gurevych, Chris Biemann和Torsten Zesch -NLP研究:这个实验室进行许多领域的研究工作:计算词汇语义学(computational lexical semantics)、利用和理解维基百科以及其他形式的wikis、情感分析、面向教育的NL P以及数位人文学(digital humanities)。Irena是计算语言学(CL)和自然语言处理(NLP)领域的著名学者。Chris曾在Powerset工作,现在在语义学领域有一些有趣的项目。Torsten有许多学生从事不同领域的研究。UKP实验室为(NLP)社区提供了许多有用的软件,JWPL(Java Wikipedia Library)就是其中之一。
- [http://www.ukp.tu-darmstadt.de/]
- 多伦多大学
- 知名的NLP学者:Graeme Hirst, Gerald Penn和Suzanne Stevenson
- NLP研究:他们有许多词汇语义学(lexical semantics)的研究以及一些parsing方面的研究。Gerald从事语音方面的研究工作。
- [http://www.cs.utoronto.ca/compling/]
- 伦敦大学学院
- 知名的NLP学者:Sebastian Riedel
- NLP研究:Sebastian主要从事自然语言理解方面的研究工作,大部分是知识库和语义学相关的工作。
- [http://mr.cs.ucl.ac.uk/]
机器学习/Python工具包
A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library