教你如何用几行Python代码识别图片文字--就是这么简单！

最新推荐文章于 2024-08-03 15:35:50 发布

湘九

最新推荐文章于 2024-08-03 15:35:50 发布

阅读量525

点赞数

文章标签： python java 小程序 linux 大数据

原文链接：https://www.tuicool.com/articles/36jErmJ

版权

本文介绍了如何利用Python结合百度的OCR接口来识别图片中的文字。首先，你需要在百度云平台注册并创建应用获取API密钥。然后，通过安装必要的库如aip、PIL和keyboard，设置快捷键监听截图，使用PIL获取截图并保存。接着，调用百度OCR API进行文字识别。最后，你可以将程序打包成.exe文件，方便随时使用。文中还展示了识别结果和打包后的应用程序示例。

摘要由CSDN通过智能技术生成

今天给大家分享的主题是用百度的接口实现图片的文字识别。

环境和配置要求

整体是用 Python 实现，所需要使用的第三方库包括 aip 、 PIL 、 keyboard 、 pyinstaller ，如未安装，可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。

百度接口

打开https://cloud.baidu.com/，

如未注册请先注册，然后登录点击管理控制台，点击左侧产品服务 → 人工智能 → 文字识别 ，点击创建应用，输入应用名称如 Baidu_OCR ，选择用途如 学习办公 ，最后进行简单应用描述，即可点击 立即创建 。

会出现应用列表，包括 AppID、API Key、Secret Key 等信息，这些稍后会用到。

打开步骤

具体实现步骤

整个程序的大致思路是，在用截图软件获得截图之后，交给百度接口识别，并返回结果，当然，也可以是本地图片识别，我用的是QQ自带截图软件，快捷键CTRL+ALT+A用来打开截图，在选中所截区域后，按Enter键即可保存到粘贴板中，也可用其他截图软件。

①获取截图

keyboard类库是用来监听键盘动作的，所以在有快捷键按下之后，便会有相应动作。并用PIL中的 ImageGrab 来获取到剪切板中的图片并生成本地图片文件。

②调用Baidu aip识别并打印文字

先用注册时生成的应用的AppID、API Key、Secret Key初始化应用，再读取保存到的图片并打印识别的文字。

运行结果如图所示：

运行截图

我们还可增加一个无限循环使得一直能截图。

③调用打包程序生成专属识别文字小程序

用pyinstaller库实现小程序的打包，生成.exe文件，这样就能随时识别文字了。在命令行中用pyinstaller xxx.py来打包生成exe文件，最后在生成的dist文件夹即可找到xxx.exe文件如下：

专属文字识别小程序

附图图片识别案例

此文转载文，著作权归作者所有，如有侵权联系小编删除！

原文地址：https://www.tuicool.com/articles/36jErmJ

需要代码的或者想了解更多的（点击这里下载）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。