[开箱即用] Python 使用 百度 OCR 试图

简介

首先先去 百度AI 的云平台注册一个账户,获取APP_ID、API_KEY、SECRET_KEY 填入代码中即可使用。

代码

# -*- coding:utf-8 -*-
import cv2
from aip import AipOcr

import tap

""" 你的 APPID AK SK """
APP_ID = 'XXXXXXXX'
API_KEY = 'XXXXXXXX'
SECRET_KEY = 'XXXXXXXX'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)


# 打开图片
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


# 分析file图片
def analysis_screenshot(fname='screenshot.png'):
    image = get_file_content(fname)
    try:
        results = client.general(image)["words_result"]
        return results
    except BaseException as e:
        print(e)
        return []


# 分析坐标
def analysis_screenshot_base(fname='screenshot.png'):
    image = get_file_content(fname)
    try:
        results = client.basicGeneral(image)["words_result"]
        return results
        # 只回复纯文字
    except BaseException as e:
        print(e)
        return []


# 调试用
def dev():
    fname = 'screenshot.png'
    image = get_file_content(fname)

    """ 调用通用文字识别, 图片参数为本地图片 """
    # 还可以使用身份证驾驶证模板,直接得到字典对应所需字段
    results = client.general(image)["words_result"]
    print(results)
    img = cv2.imread(fname)
    for result in results:
        text = result["words"]
        location = result['location']
        print(location)
        print(text)
        # 画矩形框
        cv2.rectangle(img, (location["left"], location["top"]),
                      (location["left"] + location["width"], location["top"] + location["height"]), (0, 255, 0), 2)

    cv2.imwrite("bd_api.jpg", img)


if __name__ == '__main__':
    print(analysis_screenshot_base('pic.jpg'))

更多资料

百度OCR文档:https://ai.baidu.com/ai-doc/OCR/9kibizye4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Johnzqh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值