共词聚类分析

一、概念

共现聚类分析法,通过文献计量和聚类统计的方法,计算主题词之间的联系密切程度(在同一篇文献共同出现的频率),将距离较近的主题词聚集在一起,形成一个个概念相互独立的类团,使得类团内属性相似性最大,类团间属性相似性最小。

二、关键流程

1、聚类时距离的确定

在进行聚类分析时,类组合的确定有两种概念方式,一是类与类之间的距离,二是点与点之间的距离。

(1)类间距离:例如组间距离法

(2)点间距离:例如欧氏距离法

2、聚类方法的确定

聚类分析是物以类聚的一种统计分析方法,实质是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类,目前常用的聚类方法有:

(1)K类中心聚类(快速聚类)

(2)等级聚类(系统聚类、层次聚类):

a.分解法:开始先把所有合体视为一个大类,然后根据距离和相似性逐层分解,直到参与聚类的每个个体自成一类为止。

b.凝聚法:先把n个元素看成n类,然后将性质最为接近的2类合并成一个新类,得到n-1类,再从中找出最接近的2类加以合并变成n-2类,直到所有的元素全聚在一类之中。

三、主要分析指标

1、粘合力 用以衡量类团内各主题词对聚类成团的贡献程度 , 表达每个主题在类团的聚集过程中所起作用的程度,在类团中 , 粘合力最大的词称为中心词。

2、密度:用来量度使字词聚合成一类的这种联系的强度 , 也就是该类的内部强度。

3、向心度:向心度用来量度一个类团与学科其它类团的联系程度 。

四、类团的可视化分析方法

为进一步将聚类的结果以更直观的可视化方法显示出来 , 可视化方法可分为类团关系图与战略坐标图两种 。

1、类团关系图

类团关系图主要用于明确类团间的关系 , 类团间的关系强弱以连接线的粗细来表示 , 两个类团的关系越强 , 连接它们间的线条越粗 。 两个类团间的关系强度 , 由这个两类团中的所有成员间所组成的词对 , 这些词对在同一篇文献中出现的频率的总和即为两个类团间系联的强度值 。

2、战略坐标图

主要用来描述某一研究领域内部联系情况和领域间相互影响情况,在战略坐标中 , X 轴为向心度 , 表示领域间相互影响的强度 , Y 轴为密度 , 表示某一领域内部联系强度 。 以向心度和密度为参数绘制成的二维坐标即为战略坐标 , 它可以概括地表现一个领域内亚领域的结构 。



  • 2
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值