第1关:学会使用 Gensim
本关任务:根据本关所学有关 Gensim 的基础知识,完成使用 Gensim 构建 LDA 模型并通过所有测试用例。
为了完成本关任务,你需要掌握:
Gensim 的基础概念;
使用 Gensim 构建模型。
Gensim 简介
Gensim 是一款开源的第三方 Python 工具包,用于对原始的非结构化的文本进行无监督地学习,从而得到文本隐层的主题向量表达。它支持包括 TF-IDF,LSA,LDA 和 word2vec 在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的接口。
Gensim 包含有以下特征:内存独立;有效实现了许多流行的向量空间算法;对流行的数据格式进行了 IO 封装和转换;在其语义表达中,可以相似查询。
from gensim import corpora, models
import jieba.posseg as jp, jieba
from basic impor