大数据文摘出品
来源:Fast.ai
作者:宁静
被无数行家推荐的Fast.ai系列课程又有更新啦!这门最新课程专注自然语言处理实战。
这门课程最初于2019年夏季在旧金山大学数据科学硕士课程中讲授,现在已经可以在Fast.ai的官网上观看学习了。
先上网址:
https://www.fast.ai/2019/07/08/fastai-nlp/
为什么要学习这门课?
相比其他的NLP教学视频,该课程从代码带领学习者入门,通过先上手玩儿代码,引领学习者从实践中探索NLP的原理。课程中的所有代码都在Github中开源,所有的教学视频在YouTube中都能找到。
课程源码的Github地址:
https://github.com/fastai/course-nlp
课程的YouTube视频地址:
https://www.youtube.com/playlist?list=PLtmWHNX-gukKocXQOkQjuVxglSDYWsSh9
能学到什么?
实战内容涵盖NLP中的一些经典问题,包括:对文章的主题建模(topic modeling)、文本的情感分类(识别一个评论的携带的情绪是积极的还是消极的)、对语言的建模、和现在比较流行的机器翻译。实战总是建立在理论的基础上,在coding的过程中,也有对基本概念的渗透,如:regex(正则表达式)、SVD(矩阵的奇异值分解)、naive bayes(朴素贝叶斯)、tokenization(分词)这些常见名词和应用场景的易懂解释。
除此外,还有对深度学习领域中神经网络的剖析,包括RNNs和seq2seq模型、attention机制以及机器翻译结构。
课程特色
除了基本原理层面的解释和实战上的熟悉,这门课程可谓是全程干货:
-
介绍了自然语言处理中的迁移学习;
-
支持多语言;
-
Nikhil Garg关于嵌入字如何编码的特别演讲(以及过去100年来的变化情况);
-
NLP的发展进步如何推动虚假信息的识别。
课前准备
该课程使用Jupyter笔记本进行Python教学,使用sklearn,nltk,pytorch和fastai等库。所以熟悉 Python中的数据处理以及机器学习概念(如训练和测试集)是必要的。最好还有一些PyTorch和神经网络的经验。
但是!如果你对这门课程感兴趣,但不确定你是否有正确的背景知识,那不如就上手试试!等你发现了一些你不熟悉的概念,再停下来研究一下也是可以的。