【百度AI】用代码调用OCR服务

最新推荐文章于 2025-04-13 07:56:29 发布

沧海一笑-dj

最新推荐文章于 2025-04-13 07:56:29 发布

阅读量390

点赞数 2

分类专栏：人工智能文章标签：百度 ocr Python Python人工智能 Python车牌识别车牌识别

本文链接：https://blog.csdn.net/dengjin20104042056/article/details/131585218

版权

人工智能专栏收录该内容

20 篇文章

订阅专栏

该文章提供了通过Python代码调用百度OCR服务的详细步骤，包括设置开发环境、获取access_token、读取图像和发送请求以识别图像中的文字。用户可以通过一键测试包简化在Windows上的测试流程，同时文章附有视频教程以帮助开发者更好地理解和使用该服务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

00. 目录

文章目录

01. 使用代码调用文字识别服务API概述

提供通过代码快速调用 OCR 通用文字识别（高精度版）API 的样例，帮助您通过简单的代码编写快速熟悉并使用文字识别服务。

02. 开发环境

选择用 Python 来快速搭建一个原型，关于如何安装 Python。可以参考下表列出的不同操作系统的安装方法进行安装。

Python的官方下载地址：下载Python
在这里插入图片描述

03. Windows 快速测试包

Windows 平台的用户如果对上述的 Python 安装感到困难，您可以下载我们的一键测试包，下载地址：Windows测试包。

解压 zip 文件后，双击 run.bat 即可测试。

04. 程序设计

4.1 新建一个 main.py

粘贴以下内容，不要忘记替换您的 API_KEY 以及 SECRET_KEY：

# coding=utf-8

import sys
import json
import base64


# 保证兼容python2以及python3
IS_PY3 = sys.version_info.major == 3
if IS_PY3:
    from urllib.request import urlopen
    from urllib.request import Request
    from urllib.error import URLError
    from urllib.parse import urlencode
    from urllib.parse import quote_plus
else:
    import urllib2
    from urllib import quote_plus
    from urllib2 import urlopen
    from urllib2 import Request
    from urllib2 import URLError
    from urllib import urlencode

# 防止https证书校验不正确
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

API_KEY = 'GmhC18eVP1Fo1ECX911dtOzw'

SECRET_KEY = 'PQ2ukO4Aec2PTsgQU9UkiEKYciavlZk8'


OCR_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"


"""  TOKEN start """
TOKEN_URL = 'https://aip.baidubce.com/oauth/2.0/token'


"""
    获取token
"""
def fetch_token():
    params = {'grant_type': 'client_credentials',
              'client_id': API_KEY,
              'client_secret': SECRET_KEY}
    post_data = urlencode(params)
    if (IS_PY3):
        post_data = post_data.encode('utf-8')
    req = Request(TOKEN_URL, post_data)
    try:
        f = urlopen(req, timeout=5)
        result_str = f.read()
    except URLError as err:
        print(err)
    if (IS_PY3):
        result_str = result_str.decode()


    result = json.loads(result_str)

    if ('access_token' in result.keys() and 'scope' in result.keys()):
        if not 'brain_all_scope' in result['scope'].split(' '):
            print ('please ensure has check the  ability')
            exit()
        return result['access_token']
    else:
        print ('please overwrite the correct API_KEY and SECRET_KEY')
        exit()

"""
    读取文件
"""
def read_file(image_path):
    f = None
    try:
        f = open(image_path, 'rb')
        return f.read()
    except:
        print('read image file fail')
        return None
    finally:
        if f:
            f.close()


"""
    调用远程服务
"""
def request(url, data):
    req = Request(url, data.encode('utf-8'))
    has_error = False
    try:
        f = urlopen(req)
        result_str = f.read()
        if (IS_PY3):
            result_str = result_str.decode()
        return result_str
    except  URLError as err:
        print(err)

if __name__ == '__main__':

    # 获取access token
    token = fetch_token()

    # 拼接通用文字识别高精度url
    image_url = OCR_URL + "?access_token=" + token

    text = ""

    # 读取测试图片
    file_content = read_file('./text.jpg')

    # 调用文字识别服务
    result = request(image_url, urlencode({'image': base64.b64encode(file_content)}))

    # 解析返回结果
    result_json = json.loads(result)
    for words_result in result_json["words_result"]:
        text = text + words_result["words"]

    # 打印文字
    print(text)