LDA是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
LDA可以用来生成一篇文档,生成时,每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”,这样反复进行,就可以生成一篇文档;反过来,LDA又是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。
spark LDA主题模型
最新推荐文章于 2024-03-28 23:53:32 发布
LDA是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
LDA可以用来生成一篇文档,生成时,每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”,这样反复进行,就可以生成一篇文档;反过来,LDA又是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。