文献摘要总结
Lifelong Learning Augmented Short Text Stream Clustering Method
遇到的问题
通过长期学习来增强短文本聚类的方法。
首先根据扫描的方式的不同,可以对现存的短文本聚类算法划分成两种类别的方法:
one-pass-based and batch-based.
1、
- 批处理方法的优点: 有更好的结果(性能优越)
- 缺点: 效率很低
2、
- 单程处理方法的优点: 效率很高
- 缺点: 对于处理稀疏性问题并不友好
解决方案
LAST结合上述两种方法优势,方法是“合并了长期学习的情景记忆模块和分散经验回放模块并应用到聚类处理的过程中”“虽然LAST也是对于每一个文本只处理一次,但是在一个确定间隙内它随机抽样一些之前遇见过的情景记忆,通过运用分散经验的回放来更新聚类特征”
结论
总结:基于两个公共数据集的经验主义的学习,表明基于LAST的方法性能跟批处理的性能类似,同时运行起来的速度跟基于单次处理的方法十分接近,也就是性能上跟批处理相媲美,在处理速度上又结合了one-pass-based的优势。