自然语言处理入门该上什么课,看什么书,有哪些工具可用?Medium作者Melanie Tosik汇总了一份资源,量子位节选了其中的课程、库、教材部分,并进行了简单的说明。
在线课程
斯坦福大学自然语言处理入门课程
教师:Dan Jurafsky & Chris Manning
https://www.youtube.com/watch?v=nfoudtpBV68&list=PL6397E4B26D00A269
斯坦福CS224d:用深度学习做自然语言处理
教师:Richard Socher
http://cs224d.stanford.edu/syllabus.html
与Manning的入门课程相比,这门课讲解了更高级的机器学习算法,以及用于NLP的深度学习和神经网络架构。
Coursera公开课:自然语言处理入门
https://www.coursera.org/learn/natural-language-processing
密歇根大学提供的NLP入门课程
库和开源工具
spaCy
网站 https://spacy.io/
博客 https://explosion.ai/blog/
demo https://spacy.io/docs/usage/showcase
一个开源Python库,有很好的用例、API文档和demo应用。
自然语言工具包 (NLTK)
网站 http://www.nltk.org/
教程 http://www.nltk.org/book/
Python NLP编程的实用入门工具,主要用于教学。
斯坦福CoreNLP
网站 https://stanfordnlp.github.io/CoreNLP/
一个高质量Java分析工具包
教材
Speech and Language Processing
第二版:http://www.cs.colorado.edu/~martin/slp2.html
第三版:https://web.stanford.edu/~jurafsky/slp3/
作者:Daniel Jurafsky & James H. Martin
自然语言处理经典教科书,覆盖了这一领域的所有基础知识。第二版可以购买纸质版,也可以在线阅读作者发布的电子版;第三版尚未出版,作者目前发布了部分章节。
本书在国内有中译本《自然语言处理综论》https://book.douban.com/subject/1390499/ 和影印版《语音与语言处理》https://book.douban.com/subject/5373023/ ,可能已断货。
Foundations of Statistical Natural Language Processing
https://nlp.stanford.edu/fsnlp/
作者:Chris Manning & Hinrich Schütze 比上一本书略高阶,主要讲NLP中的统计学方法。
中译本《统计自然语言处理基础》https://book.douban.com/subject/1224802/ ,可能已断货。
Introduction to Information Retrieval
https://nlp.stanford.edu/IR-book/
作者:Chris Manning、Prabhakar Raghavan & Hinrich Schütze
排名/搜索领域的一本好书。
中译本《信息检索导论》https://book.douban.com/subject/5252170/ 。
Neural Network Methods in Natural Language Processing
https://www.amazon.com/Network-Methods-Natural-Language-Processing/dp/1627052984
作者:Yoav Goldberg
对NLP领域神经网络应用的深入介绍。
电子版:http://u.cs.biu.ac.il/~yogo/nnlp.pdf
数据集
见Nicolas Iderhoff在GitHub上发布的NlP资源汇总:
https://github.com/niderhoff/nlp-datasets 。