参考笔记
Part 1、什么是自然语言处理
1、简介
这是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。
自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能。
2、NLP应用
- 拼写检查、关键词搜索、同义词查询
- 文本挖掘
- 文本分类
- 机器翻译
- 对话系统
- 复杂问答
3、NLP 在工业界的应用
- 检索
- 在线广告推荐
- 自动/辅助翻译
- 情感舆情分析
- 语音识别
- 聊天机器人
4、人类语言的特别之处
人类语言系统是表达说话者或者作者的意愿的。不仅仅是一个环境的信号,而是一种沟通交流。语言是用来传输有意义的信息的,这种传输连小孩子都能很快学会。人类语言是离散的、明确的符号系统。但又允许出现各种变种,比如颜文字,随意的错误拼写“I loooove it”。这种自由性可能是因为语言的可靠性(赘余性)。所以说语言文字绝对不是形式逻辑或传统AI的产物。
Part 2、什么是DL
这是机器学习的一个子集。传统机器学习中,人类需要对专业问题理解非常透彻,才能手工设计特征。深度学习(Deep Learning, DL)或阶层学习(hierarchical learning)是机器学习的一个技术和研究领域之一,通过建立具有阶层结构的人工神经网络,在计算系统中实现人工智能。
Part 3、课程安排
CS224n是斯坦福大学的推出的关于NLP的公开课,该课程cs224n(2017)共18次课程,4次大作业,采用TensorFlow框架教学,【最新版cs224n(2019)共20节课程,采用PyTorch框架】。
Part 4、为什么NLP是困难的
- 表示,学习和使用的复杂性
- 自然语言是有歧义的
- 人类语言的解读依赖于现实世界、常识以及上下文。由于说话速度书写速度阅读速度的限制,人类语言非常简练,省略了大量背景知识。
Part 5、NLP的应用