NoteExpress导入知网下载的文献无法更新题录解决办法

文章介绍了一个脚本,用于批量重命名知网下载的PDF文献,以解决NoteExpress中智能更新失效的问题。脚本针对篇名包含作者名和过长篇名的情况进行了处理,但仍需人工干预部分特殊情况。
摘要由CSDN通过智能技术生成

由于知网下载的文献是 篇名_作者 的格式,因此在导入NoteExpress中时自动读取PDF文件标题为篇名,NE的智能(弱智)更新是会失效的。

所以干脆做了个脚本一键重命名,能省去手动更新题录百分之八九十的工作量,脚本如下:

import os

def rename_files(folder_path):
    for root, dirs, files in os.walk(folder_path):
        for file_name in files:
            if file_name.endswith('.pdf'):
                # 获取文件名(不包含后缀)
                base_name = os.path.splitext(file_name)[0]

                # 判断文件名的最后五到六位是否包含_符号
                if '_' in base_name[-6:]:
                    # 删除_符号以及符号之后的内容
                    new_name = base_name[:base_name.rindex('_')] + '.pdf'
                else:
                    new_name = base_name + '.pdf'

                # 判断新文件名中是否含有...(三个英文句号)符号
                if '...' in new_name:
                    # 删除...符号
                    new_name = new_name.replace('...', '')

                # 构建新的文件路径
                new_path = os.path.join(root, new_name)

                # 重命名文件
                os.rename(os.path.join(root, file_name), new_path)

                print(f'Renamed {file_name} to {new_name}')

# 测试
folder_path = input('请输入文件夹路径:')
rename_files(folder_path)

只需要輸入文件夹路径就可以批量处理所有PDF文献(包含子文件夹), 应对的是一般情况。经过重命名处理后的文献再导入NE就可以匹配上绝大多数题录了。

这个方法会失效的情况:

1.作者名五个字以上

2.篇名太长,下载的时候会折叠出省略号 ...,这样的文献也是没办法一键识别成功的


剩下智能更新失效的部分就只能一个一个点手动更新+知网数据库+篇名相关搜索了。

  • 12
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值