- 1.知识图谱的起源与发展
- 2.知识图谱的绘制方法
- 2.1 文献计量方法
- 2.2 统计分析方法
- 3.知识图谱绘制的步骤
- 4.知识图谱绘制的工具
科学知识图谱(简称知识图谱)是现实科学知识发展进程与结构关系的一种图形[1]。其作用是使研究者对学科结构、研究内容、学科关系和研究热点有清晰的把握,并可预测学科发展前沿和趋势。但在当前科研数据总量庞大、增长快速、信息含量低、数据种类多样[2]的背景下,传统的知识图谱绘制方法、步骤和工具已经难以应对,急切需要针对大数据环境的科学知识图谱的绘制的方法及其关键技术研究。
1. 知识图谱的起源与发展
科学知识图谱以科学知识为计量研究对象,因此属于科学计量学的范畴。科学知识图谱的研究最早可以追述到普赖斯开创科学计量学[3]之时。当时普赖斯在数据方程式来表达科学发展规律的基础上,以曲线形式讲科学发展规律绘制为二维图形是并形成了最初的科学知识图谱[4]。
科学知识图谱的另一个演化前身是科学知识地图。科学知识地图是一个以二维或者三维空间表现出来的地形和人类活动以及相关特征的地理学概念,而科学知识图谱是对其的拓展和延伸。它是一个图像以一定空间形式在一定时间范围内展现与变化的系统概念,比知识地图更能揭示知识间的关系和进化规律。
现代科学知识图谱概念正式提出是2003年在Arthur M. Sackler学术研讨会上。而Shiffrin[5],Borner[6]和陈超美[7]等人的贡献奠定了现代科学知识图谱(Mapping Science)的研究基础,之后对其相关研究就如雨后春笋般涌现。我国对于科学知识图谱的研究是由刘则渊等人[8]于2004年率先引入。
2. 知识图谱的绘制方法
知识图谱的绘制需要综合运用文献计量、统计分析、数据挖掘、信息可视化、社会网络分析和信息分析等领域的研究方法,大致可分为文献计量方法、统计分析方法、数据挖掘方法三大类方法(如图1所示)。但目前为止还未有对这些方法实现并行化算法实现方面的研究。
2.1 文献计量方法
科学知识图谱属于科学计量学,因此必然文献计量学的方法,主要包括:
引文分析方法
引文分析是利用各种数学、统计学方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法[9]。引文分析大致有三种类型[10]:
- 引文数量研究,主要用于对科学家、出版物和科学机构的定性和定量评估
- 引文结构(网状或链状关系)研究,主要用于揭示科学的发展与联系。
- 引文主题(相关性)研究,主要用于揭示科学的结构以及进行信息检索。
共引分析方法。
共引分析是1973年斯莫尔等人就提出把文献共引分析作为计量文献之间关系的一种方法。共引&#