目标
把EndNote数据库里面的PDF合并导出到一个文件夹。
方案
重命名数据库PDF包含文章ID,检索.data里面的PDF,核对文章ID;合并导出。
EndNote命名
最后一个为文章ID。
例如:Zhao-2019-18
18为数据库里面的文章ID。
参考:https://blog.csdn.net/jell14/article/details/112604633
代码位置
EndNote .data文件夹中。
点击runpy.cmd运行。
文章列表
paperindex.csv 逗号隔开的文件。
红色为要导出PDF的数目,黄色为导出的文件夹,绿色为依次Cite的论文的EndNote数据库编号。
如何获得编号
word中,选择文中的citation编号,右键,edite citation>>more, 即可看到。
cmd代码
python extractpdf.py
pause
python代码
import os
import pandas as pd
from shutil import copyfile
path = './PDF/'
fileName = 'paperindex.csv'
paper_folder = os.listdir(path)
data = pd.read_csv(fileName)
paper_size = int(data['out_number'][0])+1
directory = './'+data['out'][0]+'/'
def getpdf(id):
paper1,full1 = '',''
for folder in paper_folder:
paper = os.listdir(path+folder)
paper = paper[0]
number = paper.split('-')[-1].split('.')[0]
full = path+folder+'/'+paper
if(int(number)==id):
paper1,full1 = paper,full
if(paper1==''):
return '',''
else:
return paper1,full1
if not os.path.exists(directory):
os.makedirs(directory)
for k in range(1,paper_size):
paper,full=getpdf(data['lib'][k])
if(paper==''):
print(str(k)+' is not found')
else:
out = str(k)+'-'+paper
print(out)
src = full
dst = directory+out
copyfile(src, dst)