有这个OCR程序，不用再买VIP了，Python 调用百度OCR API

最新推荐文章于 2023-08-27 10:24:22 发布

jasneik

最新推荐文章于 2023-08-27 10:24:22 发布

阅读量658

点赞数

分类专栏： Python 文章标签： python 百度 ocr

本文链接：https://blog.csdn.net/jasneik/article/details/106698262

版权

Python 专栏收录该内容

16 篇文章 8 订阅

订阅专栏

最近学习，很多东西都是视频，截图后，又想做成文档保存起来。

刚开始不多，打一下字就很快解决了。

随着时间的推移，现在越来越多的图了，管理起来确实不方便，打字有时也不能很快的解决。

所以就弄了个OCR。

1、首先 pip install baidu-aip

2、去注册个百度去帐号，然后那个OCR的API，获得APP ID，API KEY，API SECRET KEY

3，把程序里

APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'

修改成你在百度获得到APP ID，API KEY，API SECRET KEY，

相关百度的文字识别，请参考百度OCR网址：https://ai.baidu.com/ai-doc/OCR/fk3h7xune

4，修改path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture

# -*- coding:utf-8 -*-
import os

def get_image(path):
    """这里可以取到文件夹下全部的jpg与png的图像"""
    path_name = path
    files = os.listdir(path_name)
    file_name_with_path = []
    for file in files:
        if os.path.splitext(file)[1] == '.png' or '.jpg':
            file_name_with_path.append(os.path.join(path, file))
#         print(os.path.join(path, file))
    return file_name_with_path


from aip import AipOcr
APP_ID = 'YOUR APP ID'
API_KEY = 'YOUR API KEY'
SECRET_KEY = 'YOUR SECRET KEY'
 
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
 
""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

def ocr_image(image_with_path):
    """ 调用通用文字识别, 图片参数为本地图片 """
    image = get_file_content(image_with_path)
    client.basicGeneral(image)

    """ 带参数调用通用文字识别, 图片参数为本地图片 """
    # ocr_result 返回的是jason格式，是一个字典
    ocr_result = client.basicGeneral(image,)        

    # 解析识别的文字
    ocr_words = ocr_result["words_result"]
    for i in range(len(ocr_words)):
        print(ocr_words[i]['words'])

path = "YOUR PATH" #YOUR PATH 如D:\picture\ocr_picture
images = get_image(path)
for image in images:
    ocr_image(image)

这是要识别的图像，

这是识别的结果，还不错。基本没有错的。

jasneik

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
有这个OCR程序，不用再买VIP了，Python 调用百度OCR API

最近学习，很多东西都是视频，截图后，又想做成文档保存起来。刚开始不多，打一下字就很快解决了。随着时间的推移，现在越来越多的图了，管理起来确实不方便，打字有时也不能很快的解决。所以就弄了个OCR。1、首先pip install baidu-aip2、去注册个百度去帐号，然后那个OCR的API，获得APP ID，API KEY，API SECRET KEY3，把程序里APP_ID = 'YOUR APP ID'API_KEY = 'YOUR API KEY'SECRET_KE..
复制链接

扫一扫