PYTHON得到pdf页数、遍历当前文件夹

stay_foolish12

已于 2023-04-17 10:35:29 修改

阅读量4.2k

点赞数 2

分类专栏： python 文章标签： PyPDF22 pdf

于 2020-09-21 16:52:06 首次发布

本文链接：https://blog.csdn.net/stay_foolish12/article/details/108713473

版权

python 专栏收录该内容

319 篇文章 29 订阅

订阅专栏

#第一步安装PyPDF2
pip install PyPDF2

#第二步导入相应的模块
from PyPDF2 import PdfFileReader
 
 #第三步：定义相对应的函数
def get_num_pages(file_path):
    """
    获取文件总页码
    :param file_path: 文件路径
    :return:
    """
    reader = PdfFileReader(file_path)
    # 不解密可能会报错：PyPDF2.utils.PdfReadError: File has not been decrypted
    if reader.isEncrypted:
        reader.decrypt('')
    page_num = reader.getNumPages()
    return page_num

在这里插入图片描述


2#遍历文件名
def get_files():
    for filepath,dirnames,filenames in os.walk(r'E:\test2'):
        for filename in filenames:
            print(os.path.join(filepath,filename))

在这里插入图片描述
3 列出当前文件夹所有文件

src_dir = r'./'      # 源文件目录地址
 
def list_all_files(rootdir):
    import os
    _files = []

    #列出文件夹下所有的目录与文件
    list_file = os.listdir(rootdir)
    
    for i in range(0,len(list_file)):

        # 构造路径
        path = os.path.join(rootdir,list_file[i])

        # 判断路径是否是一个文件目录或者文件
        # 如果是文件目录，继续递归
        
        if os.path.isdir(path):
            _files.extend(list_all_files(path))
        if os.path.isfile(path):
             _files.append(path)
    return _files

files = list_all_files(src_dir)
print(files)