论文标题:
BERTopic: Neural topic modeling with a class-based TF-IDF procedure
论文作者:
Maarten Grootendorst
论文链接:
https://arxiv.org/pdf/2203.05794.pdf
跟着-NLP实战之BERTopic主题分析-做了一遍实验,对流程熟悉一下。
深入了解还可以看看-Bertopic主题模型原理详解-,因为不是搞AI的,看不太懂,简单了解一下。
BERTopic的代码网址(点击API可以看各种参数)
https://maartengr.github.io/BERTopic/index.htmlhttp://t.csdnimg.cn/WR3zL
Hugging Face——机器学习界的github
Hugging Face的sentence-transformers/all-MiniLM-L6-v2,提前下载(我全部下载了),
--Files and versions--
sentence-transformers/all-MiniLM-L6-v2
自己尝试用了The20NEWS新闻数据集和自己去WOS下载一些摘要这两种,都OK~