腾讯OCR接口调用——python

最新推荐文章于 2024-05-11 17:28:42 发布

qq_1925620345

最新推荐文章于 2024-05-11 17:28:42 发布

阅读量2.4k

点赞数

分类专栏： python基础文章标签： python

本文链接：https://blog.csdn.net/qq_33619359/article/details/107662585

版权

python基础专栏收录该内容

8 篇文章 0 订阅

订阅专栏

相较于百度的接口，腾讯的稍微麻烦一点。首先是旧版的，这个是从别人那儿整的，忘了是那个博客了，作者连应用ID和Key都写了出来：

// An highlighted block
import base64
import hashlib
import time
import uuid
from urllib import parse

import requests

APP_ID = "2115425241"
APP_KEY = "IS1oUQtC7Vhy91YZ"
OCR = 'https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr'


def __get_sign(params):
    # 参数升序
    param_list = list(params.keys())
    param_list.sort()
    param_str = ''
    for param in param_list:
        # 空值不参与签名
        value = params[param]
        if value:
            if param_str:
                param_str += '&'
            #    对 value进行编码
            parse_quote = list(parse.quote_plus(str(value)))
            i = 0
            for a in parse_quote:
                if a == '%':
                    parse_quote[i + 1] = str(parse_quote[i + 1]).upper()
                    parse_quote[i + 2] = str(parse_quote[i + 2]).upper()
                i += 1
            param_str += str(param) + '=' + (''.join(parse_quote))

    key_ = ("%s&app_key=%s" % (param_str, APP_KEY)).encode(encoding='utf-8')
    return hashlib.md5(key_).hexdigest().upper()


def getWork(image_path):
    params = {
        'app_id': APP_ID,
        'time_stamp': int(time.time()),
        'nonce_str': str(uuid.uuid4()).replace('-', '')[0:31]
    }
    with open(image_path, 'rb') as f:
        params['image'] = str(base64.b64encode(f.read()), 'utf-8').replace(r'\r\n', '')
    params['sign'] = __get_sign(params)


    result = requests.post(OCR, headers={"Content-Type": "application/x-www-form-urlencoded"}, data=params).json()
    print(result)
    if result['ret'] == 0:
        item_list = []
        for item in result['data']['item_list']:
            print(item['itemstring'])
            item_list.append(item['itemstring'])
        return item_list
    else:
        print('系统忙：', result['msg'])
        return result['msg']


if __name__ == '__main__':
    import glob
    import os
    path_pic='pic'
    path_save='tengxun_OCR'
    if not os.path.exists(path_save):
        os.mkdir(path_save)
    extensions=['jpg', 'JPG', 'jpeg', 'JPEG']
    for extension in extensions:
        for path in glob.glob(os.path.join(path_pic, '*.'+extension)):
            A=getWork(path)
            path_txt = path_save +'/' + path.split('/')[-1].split('.')[0]+ '.txt'
            with open(path_txt, 'w+') as file:
                for item in A:
                    file.write(item)
                    file.write('\n')

        # print('1')

另外一个就是调用的新版的通用识别，是改的官方代码，第20行改地区，22行和36行改接口模块。具体的腾讯相应的API接口那儿有文档说明。

#pip install tencentcloud-sdk-python

from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
import base64
import json
SecretId='xxxxxxxx'#自己去腾讯云上看，需要实名认证
SecretKey='xxxxxxxxxx'
def get_json(path):
    try:
        cred = credential.Credential(SecretId, SecretKey) #密钥
        httpProfile = HttpProfile()
        httpProfile.endpoint = "ocr.tencentcloudapi.com"

        clientProfile = ClientProfile()
        clientProfile.httpProfile = httpProfile
        client = ocr_client.OcrClient(cred, "ap-shanghai", clientProfile)

        req = models.GeneralAccurateOCRRequest()#这个通用还是高精度自己看着来
        #对本地图片进行base64转码【本地图片解析需要先转成base64编码】
        with open(path, 'rb') as f:
            # base64_data = base64.b64encode(f.read())
            # s = base64_data.decode()
            # ImageBase64_value = 'data:image/jpeg;base64,%s'%s
            # #params是字符串，以下进行拼接
            # params = '{"ImageBase64":"' + ImageBase64_value + '"}' #以图片Base64编码发送请求

            base64data = base64.b64encode(f.read())  # 得到 byte 编码的数据
            base64data = str(base64data, 'utf-8')  # 重新编码数据
            params = '{"ImageBase64":"' + base64data + '"}'

        req.from_json_string(params)
        resp = client.GeneralAccurateOCR(req)#GeneralAccurateOCR#GeneralBasicOCR#高精度和通用
        # A=resp.TextDetections
        # for line in A:
        #     print(line.DetectedText)
        # resp = resp.to_json_string()
        return resp
    except TencentCloudSDKException as err:
        print(err)



if __name__ == '__main__':
    import glob
    import os
    path_pic='pic'
    path_save='tengxun_OCR_23'
    if not os.path.exists(path_save):
        os.mkdir(path_save)
    extensions=['jpg', 'JPG', 'jpeg', 'JPEG']
    for extension in extensions:
        for path in glob.glob(os.path.join(path_pic, '*.'+extension)):
            path_txt = path_save + '/' + path.split('/')[-1].split('.')[0] + '.txt'
            resp = get_json(path)
            results = resp.TextDetections
            print(results)
            with open(path_txt,'w') as file:
                for line in results:
                    file.write(line.DetectedText)
                    file.write('\n')

我这也有点奇怪了，之前跑得好好的，现在返回接口返回值是None，base64编码不知道为啥出问题了。

qq_1925620345

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
腾讯OCR接口调用——python

相较于百度的接口，腾讯的稍微麻烦一点。首先是旧版的，这个是从别人那儿整的，忘了是那个博客了，作者连应用ID和Key都写了出来：// An highlighted blockimport base64import hashlibimport timeimport uuidfrom urllib import parseimport requestsAPP_ID = "2115425241"APP_KEY = "IS1oUQtC7Vhy91YZ"OCR = 'https://api.ai
复制链接

扫一扫

专栏目录