初次爬虫:读取PDF转成图片,再提取图片里的文字信息
读取PDF转成图片,再提取图片里的文字信息三步走第一步 读取PDF并转换成图片第二步 调用百度API来识别图片里面的文字信息第三步 提取自己想要的文字信息
三步走
1 读取PDF,将PDF转换成图片
2 调用百度API来识别图片里的文字信息
3 匹配想要的文字数据写入表格
来吧 开始了
第一步 读取PDF并转换成图片
import fitz #
'''
提取pdf里面的图片
记得要先 pi...
原创
2019-11-08 22:28:47 ·
642 阅读 ·
0 评论