01.总览（更新ing）

置顶 oldmao_2000

已于 2024-07-10 21:06:38 修改

阅读量906

点赞数 33

分类专栏： DL.AI NLPS 文章标签： NLP 人工智能深度学习

于 2024-07-01 19:03:23 首次发布

本文链接：https://blog.csdn.net/oldmao_2001/article/details/140107878

版权

DL.AI NLPS 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

点击目录可以快速跳转到每周课程笔记

简介

这套课程来自于deeplearning.ai，课程名称为：Natural Language Processing Specialization，NG站台，一共四课，每课分别又分四个小节，以下内容翻译至官网。
B站亦有视频：https://www.bilibili.com/video/BV16G41167p1?p=4&vd_source=b328decd6af2d04adbe559355fe73b42

Course 1: Natural Language Processing with Classification and Vector Space

主要内容
a) 使用逻辑回归和朴素贝叶斯对推文进行情感分析；
b) 使用向量空间模型发现词与词之间的关系，并使用 PCA 降低向量空间的维度和可视化这些关系；
c) 利用预先计算的单词嵌入和对位置敏感的哈希算法，编写一个简单的英法互译算法，通过近似 K 近邻搜索将单词联系起来。

Week 1: Sentiment Analysis with Logistic Regression

第1周使用逻辑回归进行情感分析
学习如何将文本特征提取为数字向量，然后使用逻辑回归为推文建立二元分类器。

Week 2: Sentiment Analysis with Naïve Bayes

第 2 周使用朴素贝叶斯进行情感分析
了解贝叶斯条件概率规则背后的理论，然后将其应用于构建自己的 Naive Bayes 推文分类器。

Week 3: Vector Space Models

第 3 周矢量空间模型
矢量空间模型可以捕捉词与词之间的语义和关系。您将学习如何创建单词向量来捕捉单词之间的依赖关系，然后使用 PCA 在两个维度上可视化它们之间的关系。

Week 4: Machine Translation and Document Search

第 4 周机器翻译和文档搜索
学习如何转换单词向量，并使用对位置敏感的哈希算法将其分配到子集，以执行机器翻译和文档搜索。

Course 2: Natural Language Processing with Probabilistic Models

主要内容：
a) 利用最小编辑距离和动态编程创建一个简单的自动更正算法；
b) 应用维特比算法进行语音部分（POS）标记；
c) 使用 N-gram 语言模型编写更好的自动完成算法；
d) 编写自己的 Word2Vec 模型，该模型使用神经网络，使用连续词袋模型计算词嵌入。

Week 1: Auto-correct

第 1 周自动更正
了解自动更正、最小编辑距离和动态编程，然后建立自己的拼写检查程序来纠正拼写错误的单词。

Week 2: Part-of-Speech (POS) Tagging and Hidden Markov Models

第 2 周语音部分（POS）标记和隐马尔可夫模型
了解马尔可夫链和隐马尔可夫模型，然后使用它们为《华尔街日报》文本语料库创建语音部分标签。

Week 3: Auto-complete and Language Models

第 3 周自动完成和语言模型
通过计算序列概率了解 N-gram 语言模型的工作原理，然后使用 Twitter 文本语料库建立自己的自动完成语言模型。

Week 4: Word Embeddings with Neural Networks

第4周使用神经网络进行词嵌入
了解词嵌入如何承载词的语义，使其在 NLP 任务中发挥更大作用。然后建立自己的连续词袋模型，从莎士比亚文本中创建词嵌入。

Course 3: Natural Language Processing with Sequence Models

主要内容：
a) 利用 GLoVe 词嵌入训练神经网络，对推文进行情感分析；
b) 使用门控递归单元（GRU）语言模型生成合成莎士比亚文本；
c) 使用具有线性层的 LSTM 训练递归神经网络来执行命名实体识别（NER）；
d) 使用孪生LSTM 模型来比较语料库中的问题，并识别那些措辞不同但含义相同的问题。