《学术小白学习之路15》英文文本的LDA主题建模与预测 一、数据 二、英文分词 三、向量化 四、一致性和困惑度得分 五、LDA建模分析 六、模型预测 七、完整代码 一、数据 gensim版本是gensim-3.8.3,根据自己系统要求以及pyhton版本选择合适的版本,强调一下最好使用3.8.3版本,不然会报错。 Python版本是3.6 在运行之前需要先下载相应的包 import nltk # 下载所需的nltk数据(第一次运行时需要) nltk.download('stopwords') nltk