使用LDA模型对新的文档进行分类

最新推荐文章于 2023-07-21 16:53:34 发布

呆萌的代Ma

最新推荐文章于 2023-07-21 16:53:34 发布

阅读量2.5k

点赞数 3

文章标签： lda

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/90736440

版权

人工智能专栏收录该内容

28 篇文章 2 订阅

订阅专栏

核心代码很简单：

import gensim
from 自己的工具类 import get_seg_content

# lda_model 为已经训练好的LDA模型
# content 为一条文本内容
def get_topic(lda_model, content):
    # get_seg_content() 方法是对文本进行分词
    content = get_seg_content(content)
    dictionary = gensim.corpora.Dictionary([content])
    corpus = dictionary.doc2bow(content)  # 文档转换成bow
    topics = lda_model.get_document_topics(corpus)  # 得到新文档的主题分布
    return topics

lda_Model可以使用这行代码读取：

lda_model = gensim.models.ldamodel.LdaModel.load('../models/lda模型位置')

content是一条文本：

content = '巴拉巴拉。。。'

根据以上的代码，可以构造符合自己项目的代码，比如content换成文本列表什么的

优惠劵

呆萌的代Ma

关注关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
使用LDA模型对新的文档进行分类

核心代码很简单：import gensimfrom 自己的工具类 import get_seg_content# lda_model 为已经训练好的LDA模型# content 为一条文本内容def get_topic(lda_model, content): # get_seg_content() 方法是对文本进行分词 content = get_seg_cont...
复制链接

扫一扫