Python之PDF提取表格数据
提取PDF文件中的表格数据是一个很常见的需求,为此我们经常付费,其实实现起来比较容易这里使用camelot提取数据import camelottables = camelot.read_pdf(pdf_filepath, pages='1-end')for item in tables: df = item.df # item.to_csv('test.csv') # item.to_excel('test.xlsx')pages使用’1-end’就可以读取pdf文.
原创
2021-05-28 06:11:04 ·
357 阅读 ·
0 评论