关于 NLP
NLP:Natural Language Processing,自然语言处理。
NLP 是 AI 的一个子领域。
NLP: 自然语言处理,数据是文本。
CV: 计算机视觉,数据是图像。
发展
-
萌芽期(1956年以前)
贝叶斯方法、隐马尔可夫、最大熵、支持向量机……,主流仍为基于规则的理性主义方法; -
快速发展期(1980~1999年)
基于统计、基于实例和基于规则的语料库技术在这一时期蓬勃发展; -
突飞猛进期(2000年至今)
神经网络与深度学习;
基础任务
- 词法分析
序列标注:分词、词性标注(POS)、命名体识别(NER) - 句法分析(Syntatic Analysis)
- 语义分析(Semantic Analysis)
- 句子关系判断
语义相似判断 - 句子生成
机器翻译 - 文本分类
情感分析
应用
-
关键词抽取:抽取目标文本中的主要信息;
-
文本挖掘:主要包含对文本的聚类、分类、信息抽取、摘要、情感分析及对挖掘的信息和知识的可视化、交互式的呈现界面;