一篇将话题探测看做是学习一个相似度方程的论文
1.论文通过从标注好的数据中学习一个pairwise tweet 相似度函数
2.应用一个聚类算法在相似度函数上,
实验表明,
1.Twitter内容可以用来改进主题检测过程仅使用内容信号;
2.在主题检测聚类过程中,学习相似函数进行有监督学习是一种灵活的方法。
方法:
2.1 Modeling Similarity as a Classification TaskLearning a Similarity Function
==》
特征提取
Term features;jaccard\tfidf\
Semantic Features
Metadata Features
Time-aware Features