目前百度AI的OCR已经能实现一定精度的图片文字识别,可以将图片格式的文字转换为文本。
以下为通过Python调用BAIDU OCR的API实现图片转化文文本。
第一步:安装百度人工智能的库 pip install baidu-aip 注意虽然调用时使用from aip import AipOcr但是安装包的名词是baidu-aip而不是aip。
第二步:开通百度云的OCR功能,获取相应的 APP_ID 、API_KEY、SECRECT_KEY 其中普通文字识别每天 50000 次免费调用次数, 高精度识别每天 800 次免费调用次数。
百度云注册账号 https://cloud.baidu.com/?from=console
管理应用 https://console.bce.baidu.com/ai/#/ai/ocr/overview/index 创建一个文字识别的应用。
![c6f5cbbd3e32e488a1972a62402faacf.png](https://img-blog.csdnimg.cn/img_convert/c6f5cbbd3e32e488a1972a62402faacf.png)
第三步:使用Python调用OCR实现图片转文字,以下为简单的样例。
import sys
import os
import glob
from os import path
from aip import AipOcr
from PIL import Image
#mupic2text mu可以对文件路径下所有的文件转化,pi