Siraj Raval自然语言处理NLP指南

最新推荐文章于 2020-07-29 17:44:49 发布

荣•厚德载物

最新推荐文章于 2020-07-29 17:44:49 发布

阅读量255

点赞数

分类专栏： AI学习记录---NLP自然语言语音

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zr940326/article/details/97652622

版权

AI学习记录---NLP自然语言语音专栏收录该内容

9 篇文章 0 订阅

订阅专栏

下面是 Siraj Raval，对学习自然语言处理的一份建议指南。

详细原地址请看：https://github.com/zr940326/Learn-Natural-Language-Processing-Curriculum

视频地址：https://youtu.be/GazFsfcijXQ

第一周：自然语言文本处理能力（语言术语+预处理技术）

描述：

NLP概述（语用学，语义学，语法，形态学）
文本预处理（词干化，词形还原，标记化，删除停用词）

视频讲座

阅读作业：

语音和语言处理第1-2章第3版，幻灯片

项目：

看1-1到3-4学习NLTK https://github.com/hb20007/hands-on-nltk-tutorial
然后使用NLTK在您选择的数据集上执行词干化，词形化，标记化，删除词

第二周：语言模型和词汇（历史，流行模型）

描述：

词典
预深度学习统计语言模型预深度学习（HMM，主题建模与LDA）

视频讲座：

https://courses.cs.washington.edu/courses/csep517/17sp/讲座2-6

阅读作业：

来自UWash课程的4,6,7,8,9,10

额外

LDA博客文章：https：//medium.com/@lettier/how-does-lda-work-ill-explain-using-emoji-108abf40fa7d

项目

https://github.com/TreB1eN/HiddenMarkovModel_Pytorch为PyTorch中的天气预测构建隐马尔可夫模型

第三周：神经网络和词镶入（项目实战）

视频讲座：

http://web.stanford.edu/class/cs224n/index.html#schedule讲座1-5

阅读作业

从课程建议读数

项目

3分配可视化和实现Word2Vec，在PyTorch中创建依赖解析器（它们是stanford课程的分配）

第四到第五周：序列建模

描述：

序列到序列模型（翻译，摘要，问答）
基于注意力的模型
深层语义相似度

视频讲座

https://www.coursera.org/learn/language-processing第4周

阅读作业

在Deep Semantic Similarity Models上阅读本文https://kishorepv.github.io/DSSM/
第10章关于序列建模的深度学习书http://www.deeplearningbook.org/contents/rnn.html

项目

3分配，创建翻译和摘要。所有seq2seq型号。在pytorch。

第六周：对话系统

描述

语音识别
对话管理员，NLU

视频讲座

https://www.coursera.org/learn/language-processing第5周

阅读作业

本书第24章https://web.stanford.edu/~jurafsky/slp3/24.pdf

项目

使用Pytorch https://github.com/ywk991112/pytorch-chatbot创建一个对话系统，使用DialogFlow创建一个面向任务的对话系统来订购食物

第七周：转移学习（自己的模型）

视频讲座

我在BERT和GPT-2上的视频，如何建立生物医学启动：
https://www.youtube.com/watch?v=bDxFvr1gpSU
https://www.youtube.com/watch?v=J9kbZ5I8gdM
https://www.youtube.com/watch?v=0n95f-eqZdw
使用BERT / GPT-2 / ELMO转学

阅读作业

项目

使用此https://github.com/huggingface/pytorch-pretrained-BERT#examples选择2个模型，将其用于9个下游任务之一，比较它们的结果。

第八周：现代nlp研究主题

描述

视觉语义学
深度强化学习

视频讲座

CMU视频https://www.youtube.com/watch?v=isxzsAelQX0
本https://www.edx.org/course/natural-language-processing-nlp-3的模块5-6

阅读作业

项目：

政策梯度文本摘要https://github.com/yaserkl/RLSeq2Seq#policy-gradient-w-self-critic-learning-and-temporal-attention-and-intra-decoder-attention重新实现pytorch

----------------最后推荐一本好书：

https://zh.d2l.ai/ 动手学习机器学习

荣•厚德载物

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

荣•厚德载物 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。