最近在看一篇论文,论文题目是《基于时间序列聚类的主题发现与演化分析研究》,其基本思路是根据论文中关键词的共现次数以及每一个关键词总的出现次数,计算关键词矩阵的Ochiia 系数。使用的公式为:
然后将Ochiia系数作为关键词之间相似性度量的值,根据近邻传播聚类算法对系数矩阵进行聚类分析。 为了重现论文的方法,我利用sklearn中的AffinityPropagation包来进行近邻聚类分析。
ap = AffinityPropagation(max_iter=600,convergence_iter=35,
affinity = "precomputed").fit(matrix)
我的实验中对700多个高频关键词可以进行有效的聚类,并形成120多个聚类中心。至此都还是比较容易实现的。现在问题是论文在分析聚类结果时,生成了一幅关键词聚类的结果图,很直观形象(如下图所示,为论文中的结果图)。
据论文作者说,该图是利用gephi工具生成的。可是我找遍gephi教程也不清楚该如何利用gephi生成这样的聚类图。有没有哪位大神清楚的,请不吝赐教。
参考论文:
[1] 李海林,邬先利,基于时间序列聚类的主题发现与演化分析研究[J],情报学报,2019.10