练手数据
使用先前做养老服务文献计量相关实验时为CiteSpace所下载的结构化的数据,原始数据为纯文本。
(原始数据可以通过下面的链接自取,其中包含1762篇文献的结构化数据。)
链接:https://pan.baidu.com/s/1IzP5VLAlz3h82kD0BZXU5Q
提取码:ywbx
复制这段内容后打开百度网盘手机App,操作更方便哦
数据预处理
1、用Python编程提取出其中的摘要部分。
"""
抽取出download_9920.txt文件中所有文献的摘要部分
并按行显示在文件data_9920_abstract.txt中
"""
fi = open("D:/textAnalysis/project/knowledgeMapping/download_9920.txt","r",encoding="utf-8")
fo = open("D:/textAnalysis/project/knowledgeMapping/data_9920_abstract.txt","w",encoding="utf-8")
wflag =False #写标记
newline = [] #创建一个新的列表
for line in fi : #按行读入文件,此时line的type是str
if "AB" not in line:
wflag = False
if "AB" in line: #检验是否到了要写入的内容
wflag = True
if wflag == True:
K = list(line