“东方国信杯”大赛自然语言处理入门-笔记
一、自然语言处理概念
1.什么是自然语言
自然语言是人类之间交流传播的工具,具有创新性和歧义性。
2.自然语言处理
自然语言处理的目的:理解人类语言的语义信息。
本质:从无结构序列中预测由结构语义。
自然语言处理是AI关键问题之一。
3.自然语言的特点
4.技术上的挑战
语言知识和世界知识都是通过离散符号表示。
5.表示学习
分布式表示:将离散的信息实现跨粒度、跨领域、富知识的语言理解
6.典型应用-精准广告投放、搜索引擎、推荐系统、语音助手、机器翻译、关键词抽取、观点挖掘与情感分析
7.深度学习的突破、挑战
二、Embedding
1.基本的语言模型
句子中每一个单词都有根据上下文预测自己的过程,把所有单词的产生概率乘起来概率最大的,就是像人类的自然语言。