python实现pdf到excel的自动批量转换
做的一个法拍房源地图可视化项目,获取的房源都是Pdf格式,需要转换成excel格式进行再进行处理,先把转换代码分享一下。
pdf格式如下:
转换后的excel:
备注:需要pip 安装pdfplumber库,试了其它的库还是这个最好用。
转换的完整代码如下:
import os
import pandas as pd
import sys
import importlib
import math
import csv
import pdfplumber
importlib.reload(sys)
dir = '/Users/awesomeo/map/foreclosure' #存放pdf的文件夹
def pdf_to_excel(