python 调用百度ocr_文字识别接口，识别图片上的文字

最新推荐文章于 2024-06-17 11:20:14 发布

littleZhuHui

最新推荐文章于 2024-06-17 11:20:14 发布

阅读量4.3k

点赞数 11

分类专栏： python 编程语言文章标签： python 百度OCR 文字识别编程接口

本文链接：https://blog.csdn.net/littlezhuhui/article/details/101367153

版权

编程语言同时被 2 个专栏收录

67 篇文章 1 订阅

订阅专栏

python

48 篇文章 5 订阅

订阅专栏

今天试用了一下百度ocr_文字识别功能。

我的想法是用python编程的方式调用百度ocr_文字识别，上传一幅图片，识别图片上的文字

整个过程不难，这里将一些关键点记录下来。

第一步注册或登陆百度云账号，创建百度应用

在这里插入图片描述

进入“百度云”的控制台，如下所示：
在这里插入图片描述
点击左侧导航栏中的“文字识别” 然后“创建应用”

创建应用的目的是为了生成三个字符串: appId, apiKey, secretKey 。这三个串在后面的python编程中需要用到

当应用创建完成后，可以看到与应用对应的这三个字符串：
在这里插入图片描述
把上面这三个字符串的内容复制下来，以后在python编程中要使用。

接下来点击左侧的SDK下载
在这里插入图片描述

第二步，下载SDK

我选择了python SDK进行下载
在这里插入图片描述

下载得到压缩包文件： aip-python-sdk-2.2.15.zip

将该包解压到本地：
在这里插入图片描述

打开CMD命令窗口，进入到以上setup.py文件所在目录。执行命令
python setup.py install

这一命令将 “aip”包安装到了 python的安装目录中的Lib\site-packages 子目录。

第三步编写测试代码

下面就可以编写一个测试程序，测试一下是否可以调用接口，识别图片上的文字
test.py


#测试百度在线图片文本识别包
#导入百度的OCR包

from aip import AipOcr

if __name__ == "__main__":
    
    #此处填入在百度云控制台处获得的appId, apiKey, secretKey的实际值
    appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy'] 
    #创建ocr对象
    ocr = AipOcr(appId, apiKey, secretKey)
    with open('pic/piece0.png', 'rb') as fin:
        img = fin.read()    
        res = ocr.basicGeneral(img)
        print(res)

用前面提到的appId, apiKey, secretKey 三个字符串的值替换源码中相应的内容
并且在源码文件test.py所在的目录下有一个字目录pic,其中存放有一张图片
piece0.png
在这里插入图片描述
我故意选择了一张有些歪斜，有些杂点的图片，看看识别效果如何。

识别结果如下：

在这里插入图片描述
可以看到，图片上的文字：“连长” 被正确地识别了出来。

littleZhuHui

关注

11
点赞
踩
43

收藏

觉得还不错? 一键收藏
3
评论
python 调用百度ocr_文字识别接口，识别图片上的文字

今天试用了一下百度ocr_文字识别功能。我的想法是用python编程的方式调用百度ocr_文字识别，上传一幅图片，识别图片上的文字整个过程不难，这里将一些关键点记录下来。第一步注册或登陆百度云账号，创建百度应用进入“百度云”的控制台，如下所示：点击左侧导航栏中的“文字识别” 然后“创建应用”创建应用的目的是为了生成三个字符串: appId, apiKey, secret...
复制链接

扫一扫