CSV 格式文件转 xlsx 文件
获取pdf表格中的内容
pdf内容格式如下:
import pdfplumber
import pandas as pd
pdf = pdfplumber.open(r'C:\Users\86159\Desktop\问题总结.PDF')
p = pdf.pages[0]
print(p.extract_text())#获取所有内容
table = p.extract_table() #获取每行的数据,结果是list类型
print(type(table))
df = pd.DataFrame(table[1:],columns=table[0])
df1 = df.values.tolist() #转化为list类型