自然语言处理之话题建模:Neural Topic Models与LDA及传统主题模型
自然语言处理与话题建模简介
自然语言处理的基本概念
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言;自然语言认知则是指让计算机“懂”人类的语言。NLP建立在语言学、计算机科学和数学统计学的基础之上,其目标是让计算机能够理解、解释和生成人类语言,从而实现人机交互。
基础技术
- 分词(Tokenization):将文本切分为单词或短语。
- 词性标注(Part-of-Speech Tagging):识别每个单词的语法类别。
- 命名实体识别(Named Entity Recognition,NER)