利用python对中文文本数据进行LDA训练、计算概率距离

数据来自于“豆瓣读书”25名用户标注图书的一些标签(已经过分词、去停用词、去除不规范的标签),目的主要是通过对标签利用LDA得出25名用户在各主题上的概率分布,然后利用JS散度计算概率距离,从而计算25名用户的相似度,找出某个用户的近邻用户集。

2017-07-17 17:19:09

阅读数 4199

评论数 3

提示
确定要删除当前文章?
取消 删除
关闭
关闭