1
论文链接:AAAI 2021
博客链接:基于对比学习的聚类工作
现有的大部分深度聚类(Deep Clustering)需要迭代进行表示学习和聚类这两个过程。
算法过程:
- 对样本进行表示
- 对样本进行聚类
- 重复1和2
缺点:
- 一是迭代优化的过程中容易出现误差累计
- 二是聚类过程通常采用 k-means 等需要全局相似性信息的算法,使得需要数据全部准备好后才能进行聚类,故面临不能处理在线数据的局限性
提出的新方法:
2
对比学习有多火?文本聚类都被刷爆了…
上方链接是 聚类+对比学习
来更好的对文本聚类。
聚类关注高层级的语义概念,对比学习增强的语句对更关注句子级别的。