需要安装的模块
import pdfplumber
import pandas as pd
代码段:
# 读取pdf文件,保存为pdf实例 for i in range(1, 10): pdf = pdfplumber.open('pdf_to_excel.pdf') # 访问第一页 first_page = pdf.pages[i] # 自动读取表格信息,返回列表 table = first_page.extract_table() print(table) # 将列表转化为dataframe table_data = pd.DataFrame(table[1:], columns=table[0]) # 保存为excel table_data.to_excel('test_pdf{0}.xlsx'.format(i), index=False)