使用百度ocr接口

最新推荐文章于 2024-07-14 19:52:54 发布

hustlearner

最新推荐文章于 2024-07-14 19:52:54 发布

阅读量614

点赞数 1

分类专栏：代码检错与查重

本文链接：https://blog.csdn.net/Mr__666/article/details/115378057

版权

代码检错与查重专栏收录该内容

35 篇文章 0 订阅

订阅专栏

前言

由于tesseract难以满足需求，尝试调用百度的api接口。

一、准备工作

只需要使用百度账号创建一个文字识别的应用，获取其API key和Secret key，在程序中调用即可。

二、使用步骤

注意要有一个鉴权的过程，获取到代表有合法性的access token后才能发起请求；
再写提取函数即可：

def for_picture(in_path, out_path):
    url = 'https://aip.baidubce.com/oauth/2.0/token'
    data = {
        'grant_type': 'client_credentials',  # 固定值
        'client_id': '......',  # 在开放平台注册后所建应用的API Key
        'client_secret': '......'  # 所建应用的Secret Key
    }
    res = requests.post(url, data=data)
    res = res.json()
    access_token = res['access_token']

    # 通用文字识别接口url
    general_word_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"

    # 二进制方式打开图片文件
    f = open(in_path, 'rb')
    img = base64.b64encode(f.read())
    params = {"image": img,
              "language_type": "CHN_ENG"}
    request_url = general_word_url + "?access_token=" + access_token
    headers = {'content-type': 'application/x-www-form-urlencoded'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        res = response.json()["words_result"]
        with open(out_path, 'w', encoding='utf-8') as f:
            for j in res:
                f.write(j["words"] + "\n")