自然语言处理之话题建模:Latent Semantic Analysis (LSA):信息检索中的LSA应用
自然语言处理与话题建模基础
自然语言处理简介
自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究如何处理和运用自然语言;自然语言认知则是指让计算机“懂”人类的语言。NLP建立在语言学、计算机科学和数学统计学的基础之上,其目标是读取、解读、理解以及以自然语言进行沟通。
示例:中文分词
在NLP中,分词是处理中文文本的基础步骤。下面是一个使用jieba库进行中文分词的例子:
import jieba
text =