一、概念
共现聚类分析法,通过文献计量和聚类统计的方法,计算主题词之间的联系密切程度(在同一篇文献共同出现的频率),将距离较近的主题词聚集在一起,形成一个个概念相互独立的类团,使得类团内属性相似性最大,类团间属性相似性最小。
二、关键流程
1、聚类时距离的确定
在进行聚类分析时,类组合的确定有两种概念方式,一是类与类之间的距离,二是点与点之间的距离。
(1)类间距离:例如组间距离法
(2)点间距离:例如欧氏距离法
2、聚类方法的确定
聚类分析是物以类聚的一种统计分析方法,实质是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类,目前常用的聚类方法有:
(1)K类中心聚类(快速聚类)
(2)等级聚类(系统聚类、层次聚类&#