NLP
菇綡
123456789
展开
-
LDA主题模型
LDA文档主题生成模型LDA是一种文档主题生成模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。LDA是一种非监督机器学习技术,可以用来识别大规模文档集或语料库中潜藏的主题信息。它采用了词袋的方法,这种方法将每一篇文...原创 2018-12-20 19:08:48 · 604 阅读 · 0 评论 -
NLP练习
import numpy as npimport pandas as pdfrom sklearn.ensemble import RandomForestRegressor,BaggingRegressorfrom sklearn.model_selection import cross_val_scorefrom nltk.stem.snowball import SnowballS...原创 2018-12-27 15:54:36 · 385 阅读 · 0 评论