看上锁的PDF文档或者是图片的时候,如果有数量较多的文字信息想要复制过来,一般都会用到OCR软件。这次我想介绍一个如何用Python来实现读取图片文字的功能。
首先介绍一下这次主要会用到的工具,那就是百度智能云里面的通用文字识别。
首页→产品→精选推荐→通用文字识别
先看文档再使用
先查看一下技术文档,看一下需要的参数,使用方法以及输出结果的格式
参数(大部分非必选)
然后在左边找到Python,点击快速入门
首先需要安装baidu-aip,然后导入
这里面提到的三个常量需要回到上面的“立即使用”那里获取。(已登录百度账号的情况下)点击立即使用,会看到如下界面
首次注册的话是没有应用的,这个时候就需要去创建一个。
这里正常填写就ok了。虽然有使用的次数限制,但是只要有账号他的文字识别功能我们都是可以免费使用的。
创建完之后再点进管理应用,我们就能看到那三个常量了。
接下来展示一下实际使用效果。
测试用图片
在前面的技术文档那里我们已经知道他返回的数据格式了,所以我们可以直接提取并分好行。
以上就是我用Python通过借用百度的ai来实现图像文字识别的过程了。掌握了之后真的是非常简单,毕竟只是使用的话并不需要自己去解析baidu-aip的具体内容。