本系列包含:
一种基于深度学习的主题建模方法:BERTopic(理论篇)
在我的博客中已经写了很多关于 主题建模 的内容,当你准备了解 BERTopic 时,默认你已经知道了 LSA
、pLSA
、NFM
、LDA
等传统的主题建模方法。关于主题建模的前置知识我在这里不做赘述,感兴趣的同学可以看看我前几篇博客。学习 BERTopic 需要一定的机器学习基础,让我们一起开始吧!
1.总体概述
利用 BERTopic 进行主题建模可按照以下五个步骤进行:嵌入(Embeddings
)、降维(Dimensionality Reduction
)、聚类(Clustering
)、分词(Tokenizer
)、加权(Weighting scheme
)。