Python教程：利用百度API进行批量图片OCR识别

最新推荐文章于 2024-07-10 10:55:49 发布

weixin_43173396

最新推荐文章于 2024-07-10 10:55:49 发布

阅读量3.7k

点赞数 5

分类专栏： Python 应用文章标签：百度云云计算 python ocr

本文链接：https://blog.csdn.net/weixin_43173396/article/details/122945050

版权

本文介绍了如何使用Python结合百度API进行批量图片文字识别。首先，通过os模块遍历文件夹获取图片，接着创建并配置AipOcr客户端，利用百度OCR SDK进行文字识别。识别后的结果以JSON格式返回，进一步解析并保存到Word文档中。

摘要由CSDN通过智能技术生成

我最近有个需求，就是想把一批图片分别进行文字识别，网上的很多工具很多只能一张张识别，而且准确率还大打折扣。

这次利用python来开发一段脚本，最终的成果是这样的。

注意：text.doc 是新生成的

首先需要你需要把你的文件存在一个文件夹里，然后用os模块下的listdir方法来找到里边的文件，然后用一个for循环结合with open 方法打开并读取所有需要的文件，我存放在了桌面上C:\Users\itcast\Desktop\ocr

代码如下：

import os
dirs = os.listdir(r'C:\Users\itcast\Desktop\ocr')
print(dirs)
for dir in dirs:
    filepath = f"C:\\Users\\itcast\\Desktop\\ocr\\{dir}"
    print(filepath)
    with open(f"C:\\Users\\itcast\\Desktop\\ocr\\{dir}","rb") as f:
        image = f.read()

然后用第三方的应用，我这里用到的是百度API，也就是百度智能云里的应用，下方来说一下这个应该怎么使用：

首先你得有个百度账号，然后点击登陆。登陆后找到这个通用文字识别&#

最低0.47元/天解锁文章

weixin_43173396

关注

5
点赞
踩
37

收藏

觉得还不错? 一键收藏
0
评论
Python教程：利用百度API进行批量图片OCR识别

我最近有个需求，就是想把一批图片分别进行文字识别，网上的很多工具很多只能一张张识别，而且准确率还大打折扣。这次利用python来开发一段脚本，最终的成果是这样的。注意：text.doc 是新生成的首先需要你需要把你的文件存在一个文件夹里，然后用os模块下的listdir方法来找到里边的文件，然后用一个for循环结合with open 方法打开并读取所有需要的文件，我存放在了桌面上C:\Users\itcast\Desktop\ocr代码如下：import osdirs = o
复制链接

扫一扫