import pandas as pd
import numpy as np
import mglearn
from sklearn.decomposition import LatentDirichletAllocation
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
#from sklearn.feature_extraction.text import ENGLISH_STOP_WORDS
abstract = pd.read_csv('final_data.csv')
#train_text = abstract.loc[0:999,]
#train_text = train_text[(['TI', 'JI', 'PY', 'C1', 'AB', 'AU'])]
input_data = abstract['AB']
#vect = CountVectorizer(max_features=10000, max_df=0.8, min_df=10,
# stop_words&#
sklearn 实现LDA主题建模
最新推荐文章于 2024-07-22 09:31:55 发布
本文详细介绍了如何利用Python的sklearn库实现LDA(Latent Dirichlet Allocation)主题建模,通过实例解析LDA的步骤和关键参数设置,帮助读者掌握文本数据的主题分析技术。
摘要由CSDN通过智能技术生成