cs224n笔记-1 NLP和自然语言处理

最新推荐文章于 2022-07-06 15:06:40 发布

ly233

最新推荐文章于 2022-07-06 15:06:40 发布

阅读量291

点赞数

分类专栏： NLP 文章标签： NLP deep learning cs224n

本文链接：https://blog.csdn.net/ly233/article/details/88904946

版权

NLP 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. 什么是自然语言处理

NLP与计算语言学（computational linguistics）同义
目标：让计算机理解世界
语言层次：
- 形态分析（Morphological analysis）,单词的前后缀等
- 句法分析（Syntactic analysis）理解句子结构，主语啊，宾语啊等等，包括词性以及位置等
- 语义解释（semantic interpretation）得出句子含义
- 语篇处理（discourse processing）自然语言的含义通过上下文来传达
自然语言处理的应用
- 拼写检查、联想词搜索
- 下一步：希望自动从报纸等获取信息，并知道在讲什么，从而提取信息
人类语言的特别之处
- 其他诸如数据挖掘、信号处理等只是处理数据，对数据进行分析找出规律
- NLP不同，并不只是单纯的数据，而是用来传达信息的
- 是一个复杂的系统表情符号、looooove等
- 可以用连续不同的载体（声音、文字、手语）等传达相同的信息
- 稀疏性（sparsity）

2. 什么是深度学习

深度学习是机器学习的一个分支，总体来说就是怎样让电脑自动学习
与机器学习的不同：
之前的机器学习是有人类来思考一个特定的问题，找出解决的关键要素，然后设计出与该问题相关的重要特征要素，然后写代码实现。（人工设计表示和输入特征）这个过程叫做机器学习，但是机器学到什么了么？nothing，反倒是人类学到了很多。机器只是在做数值优化（numeric optimization）而已。
深度学习是表征学习（representation learning）的一个分支

表征学习理念：只向电脑提供来自世界的原始信号（视觉、语音信号等），然后电脑自动得出好的中介表达（good intermediate representations），来很好的完成任务。某种意义上说是自己定义特征
深度学习的真实含义是能够得到多层的习得表征（learned representations）

探索深度学习
因为手动设计特征太具体，而且不完整，并且需要很长时间来设计和验证，最终只能达到一定的水平。
但是learned features适应性强，训练快，不断学习，提升表现水平。

最近六七年发展迅速火爆。但是现在使用的深度学习的关键技术是80、90年代发明的。是因为当时没有海量数据。而且当时计算机算力达不到。

深度学习的成功

深度学习真正意义上第一个重大突破是语音识别（speech recognition）
第二个巨大成功的例子是计算机视觉（CV，Computer Vision）,更为有名。在ImageNet计算机视觉竞赛中的出色表现

3. 课程形式

微积分 calculus
向量 vectors
矩阵 matrices
多元微积分 multivariate calculus [,mʌltɪ'vɛəret] ['kælkjələs]
线性代数 linear algebra ['ældʒɪbrə]
概率 probability
统计 statistics
人工智能 cs221
机器学习 cs229

cs224n.stanford.edu

4. why NLP 难

人类语言模棱两可（语法不像if...else那样明确，指代不像变量那样明确，只能通过上下文）
最大的问题是自然语言是高效的通信工具，高效意味着省略。人们可以说最少的话，然后听者自动补全，理解即可。

5. NLP的深度学习简介

Deep NLP = Deep Learning + NLP

level:词汇学、句法学、语义学
深度学习一个了不起的发展是，用非常小的核心技术工具箱，在各个领域适用。而且效果比之前人工的方法好很多

深度学习和语言，都是以词义为起点。第二讲详细展开。一般用300维的向量，甚至1000维
。这些高维度的向量空间形成了语义空间，但是并没有任何含义。

句法，陈丹琦利用神经网络进行依存句法分析（dependency parsing）

谷歌翻译：
并非传统的翻译方法，用了一个大型的深层的循环神经网络，阅读原句子生成向量内部表征来代表句子，当达到句子结尾，则开始在译文中生成单词。翻译过程中依次生成单词。这被称为一种神经语言模型（neural language model）

都是通过用向量进行表示的，向量可能没有任何含义，但是向量的表达非常非常非常微妙。虽然没有结构，但却是一个非常灵活的数据结构，拥有强大的表达能力，这就是深度学习的强项。

6. 思考总结

本节课作为入门课，讲解了NLP和DL的一些历史发展背景，将DL做NLP的方法与之前传统NLP的方法进行了对比。并分析了深度学习为什么近年来成功的原因（大数据+高算力）。讲解了NLP任务的困难之处。最后引入了DL做NLP的基本方法——词向量表达。

自然语言最大的困难之处在于省略，计算机在没有人类知识背景下，想要理解一句话真的是非常困难的。但是，一旦未来技术有所突破，那将是比语音识别、计算机视觉等伟大N倍的进步，想想人类知识的传承，绝大多数依赖于书籍或者口头经验等，这些都是可以进行输入表达的，自然语言处理一旦真正理解了句子的含义，便可以可以迅速学习完整个人类社会的知识，构建一个真正智能的人工智能系统。到时候，只要有摄像头监控的地方，将视频进行智能化的表达，生成语言文字，然后整个系统就可以进行知识的更新。这个世界完全就是数字化的世界了，平常的新闻都会自动生成了，想想有点略微可怕。