将Web of Science非核心合集纯文本导入EndNote工具,Python实现DataFrame转换
在科研工作中,我们经常需要使用Web of Science(WOS)来检索论文和数据。然而,WOS通常会将搜到的文献以非核心合集的方式呈现,这样就会给我们导入到文献管理工具EndNote造成很大的麻烦,从而需要手动一个个进行录入,浪费了我们大量的时间和精力。
那么如何将WOS中的非核心合集的纯文本格式导入到EndNote?本文将为大家分享使用Python实现该功能的方法。
首先,我们需要从WOS中下载非核心合集的信息,这可以通过在WOS中搜索所需内容,然后选择“其他文件格式”中的“纯文本”进行下载得到,得到的文件名为“savedrecs.txt”。
接下来,我们需要将这个文件导入到EndNote中。这可以通过使用EndNote的“导入”功能来完成,但是这种方法通常会遇到一些问题,例如某些字段可能无法正确识别,从而导致文献信息不完整或者错误,还有很多规范化的处理也需要我们自己手动操作。因此,我们需要使用Python将其转换为pandas中的DataFrame类型数据并进行进一步的处理。
首先,我们需要载入需要的库:
import re
import pandas as pd
接下来,我们需要打开“savedrecs.txt”文件,并将其转换为DataFrame类型: