目标
首先提取多张图片中的文字,然后将提取到的所有文字保存到txt文件
图片文字提取
基础知识可以搜索百度AI,这里使用的其提供的图片文字提取接口
为了操作方便,我已经将提取图片文字和将这些文字存储到列表的函数封装成了类,代码如下
from aip import AipOcr # 提前要下载这个库
class PICRead():
def __init__(self, file_path, list_save):
self.APP_ID = '***'
self.API_KEY = '***'
self.SECRET_KEY = '***' # 这些是在申请接口时生成的个人id等,因人而异
self.path = file_path
self.list_save = list_save # 这两行接入的是自己的设计,具体情况可以自行改变
self.client = AipOcr(self.APP_ID, self.API_KEY, self.SECRET_KEY)
def get_file_content(self):
with open