我最近有个需求,就是想把一批图片分别进行文字识别,网上的很多工具很多只能一张张识别,而且准确率还大打折扣。
这次利用python来开发一段脚本,最终的成果是这样的。
注意:text.doc 是新生成的
首先需要你需要把你的文件存在一个文件夹里,然后用os模块下的listdir方法来找到里边的文件,然后用一个for循环结合with open 方法打开并读取所有需要的文件,我存放在了桌面上C:\Users\itcast\Desktop\ocr
代码如下:
import os
dirs = os.listdir(r'C:\Users\itcast\Desktop\ocr')
print(dirs)
for dir in dirs:
filepath = f"C:\\Users\\itcast\\Desktop\\ocr\\{dir}"
print(filepath)
with open(f"C:\\Users\\itcast\\Desktop\\ocr\\{dir}","rb") as f:
image = f.read()
然后用第三方的应用,我这里用到的是百度API,也就是百度智能云里的应用,下方来说一下这个应该怎么使用:
首先你得有个百度账号,然后点击登陆。登陆后找到这个通用文字识别&#