最近在研究ocr识别,也对比了一些的方法,现在来介绍一下,调用百度提供的ocr接口,小量调用的话,是不收费的.
1.首先,你要有一个百度账号,如果已经有的话,登录进去会进入到这样一个界面,点击"创建应用"
创建成功后,返回应用列表,就可以看到你所创建的信息, 主要需要注意的是AppID,API Key,Secret Key,这三个值,我们在后面的代码中调用会使用
至此,ocr的申请就算是完成了,接着,我们就需要写代码了,代码的话百度提供了的有文档,小伙伴们可以自行查看,因为笔者现在是在写python的代码,就以python的语法举例:
首先,需要安装一个百度aip库,AipOcr,命令执行如下:
pip install baidu-aip
安装完成后,就可以写代码了:,当然你要先准备一张需要识别的图片,来写入代码里的路径,AppID,API Key,Secret Key,用之前申请的值替换
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 ID' # 刚才获取的 ID,下同
API_KEY = '你的 API_KEY '
SECRET_KEY = '你的 SECRET_KEY '
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('C:/Users/wonders/Pictures/test3.jpg')
""" 调用网络图片文字识别, 图片参数为本地图片 """
client.webImage(image);
""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
""" 带参数调用网络图片文字识别, 图片参数为本地图片 """
retuls= client.webImage(image, options)
print(retuls)
主要代码就是根据百度提供的文档写的,我这里是使用的:"通用文字识别(含生僻字版)"里面的代码,
主要的使用,我们都可以在百度提供的文档中找到