今天试用了一下 百度ocr_文字识别 功能。
我的想法是用python编程的方式调用 百度ocr_文字识别 ,上传一幅图片,识别图片上的文字
整个过程不难,这里将一些关键点记录下来。
第一步 注册或登陆百度云账号,创建百度应用
进入“百度云”的控制台,如下所示:
点击左侧导航栏中的“文字识别” 然后“创建应用”
创建应用的目的是为了生成三个字符串: appId, apiKey, secretKey 。这三个串在后面的python编程中需要用到
当应用创建完成后,可以看到与应用对应的这三个字符串:
把上面这三个字符串的内容复制下来,以后在python编程中要使用。
接下来点击左侧的SDK下载
第二步,下载SDK
我选择了python SDK进行下载
下载得到压缩包文件: aip-python-sdk-2.2.15.zip
将该包解压到本地:
打开CMD命令窗口,进入到以上setup.py文件所在目录。执行命令
python setup.py install
这一命令将 “aip”包安装到了 python的安装目录中的Lib\site-packages 子目录。
第三步 编写测试代码
下面就可以编写一个测试程序,测试一下是否可以调用接口,识别图片上的文字
test.py
#测试百度在线图片文本识别包
#导入百度的OCR包
from aip import AipOcr
if __name__ == "__main__":
#此处填入在百度云控制台处获得的appId, apiKey, secretKey的实际值
appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy']
#创建ocr对象
ocr = AipOcr(appId, apiKey, secretKey)
with open('pic/piece0.png', 'rb') as fin:
img = fin.read()
res = ocr.basicGeneral(img)
print(res)
用前面提到的appId, apiKey, secretKey 三个字符串的值替换源码中相应的内容
并且在源码文件test.py所在的目录下有一个字目录pic,其中存放有一张图片
piece0.png
我故意选择了一张有些歪斜,有些杂点的图片,看看识别效果如何。
识别结果如下:
可以看到,图片上的文字 :“连长” 被正确地识别了出来。