共词网络(共现网络)学习

本文介绍了共词网络在专家专长挖掘和科学知识网络形成与演化的应用。通过社区划分揭示关键词的关联主题,以无向无权重网络表示关键词共现关系,并通过词频统计、同义词合并和高频词汇选择构建网络。这种方法能更准确地反映学科或研究方向的内在结构。
摘要由CSDN通过智能技术生成

1、基于共词网络的专家专场挖掘 刘萍

传统的专家专长挖掘是在词频分析基础上进行的,这种基于词频分析挖掘专家专长的方法没有考虑到关键词之间的关联,使得处于相对低频关键词表达的主题不能被挖掘出来且很多高频关键词是一些没有实际意义的词,这不利于准确和全面地挖掘专家专长。
共词网络就是从关键词之间的共现关系角度建立的网络。

共词网络的构建:
对专家文档集合中关键词进行合并同义词、去除低频词后,按照关键词在每篇文章中的共现情况生成关键词共词网络。考虑到任何两个词只要共现就认为有语义关联,因此将该共词网络设置为一个无向无权重的网络。

社区划分:
关键词之间的语义关联可以通过社区结构划分来实现,一个社区就是一个主题。专家专长并不单一,表现在共词网络中的关键词社区应该不止一个。因为共词网络是一种特殊的复杂网络,故在构建单个专家共词网络之后可以借助复杂网络理论中社区划分方法将共词网络划分为不同的社区。

数据预处理&网络构建:
本文选择信息管理学院管理科学系;
从CNKI中收集10名教授的898篇期刊论文作为研究对象;
抽取每篇文献的关键词,形成一个关键词集合;
对这个集合进行词频统计、同义词合并、通用词去除、选取高频词汇作为共词网络节点。
每个教授选择出了*个高频词汇;
分别构建各自的高频关键词的二值邻接矩阵,……构建成该教授的*个高频关键词的共词网络图

2、科学知识网络的形成与演化(1):共词网络方法的提出 王晓光   2009年
共词网络及其构建方法文献提出,由文章关键词及其共现

  • 4
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值