- 背景
最近在做毕业设计,需要利用LDA模型对提取文本数据中的主题,以完成文本的分类工作,但是在实践过程中,使用gensim训练LDA模型,多次运行得到的结果总是不同(参数相同的情况下)。 - 解决方式:
去看了gensim的相关文档,发现有一个参数 random_state,相关的解释是:
random_state:({np.random.RandomState, int}, 可选) – 一个随机状态对象或生成一个随机状态对象的种子。用于再现性。(保持每次模型训练的一致性)
所以为了保证模型在多次运行的过程中,都能都到唯一的结果,将random_state设置为整数,即可解决。