参加CyberC会议,会议的论文集文件名全是字母+数字,找自己想看的很难受,就用python改了下。
环境说明:
(1)python3.6
(2)PyPDF2库(直接pip安装就行)
(3)文件的结构说明,如下图:
代码如下:
import os
from PyPDF2 import PdfFileWriter, PdfFileReader
from shutil import copy2
src_dir = 'F:\CyberC文献\CyberC2018' # 源文件目录地址
des_dir = 'F:\CyberC文献\CyberC2018-txt' # 新文件目录地址
num = 0
def list_all_files(rootdir):
import os
_files = []
list = os.listdir(rootdir) #列出文件夹下所有的目录与文件
for i in range(0,len(list)):
path = os.path.join(rootdir,list[i])
if os.path.isdir(path):
_files.extend(list_all_files(path))
if os.path.isfile(path):
_files.append