调用腾讯云的语音识别(一句话识别)接口-Python版

最新推荐文章于 2024-05-30 09:07:33 发布

常城

最新推荐文章于 2024-05-30 09:07:33 发布

阅读量3.8k

点赞数

分类专栏： Python 人工智能文章标签：语音识别腾讯云 python

本文链接：https://blog.csdn.net/chenggong2dm/article/details/122128025

版权

Python 同时被 2 个专栏收录

81 篇文章 20 订阅

订阅专栏

人工智能

3 篇文章 0 订阅

订阅专栏

浪费了2个多小时去调试，所以记录一下代码。

接上文，可以直接利用上一篇文章里，返回的音频数据，再传回给腾讯接口，进行识别。


# #################################
# Copyright(C) 2012-2017
# Environment:        python 3.9.7
# Package:                       -
# D&P Author By:            常成功
# Create Date:          2021-12-23
# Modify Date:          2021-12-23
# #################################

# 描述：
# 访问腾讯云的语音识别(一句话识别)A Sentence Recognition（ASR）

import base64
import hashlib
import hmac
import requests
import time
import random

secret_id = "你的密钥"
secret_key = "你的密钥"


def get_string_to_sign(method, endpoint, params):
    s = method + endpoint + "/?"
    query_str = "&".join("%s=%s" % (k, params[k]) for k in sorted(params))
    return s + query_str


def sign_str(key, s, method):
    hmac_str = hmac.new(key.encode("utf8"), s.encode("utf8"), method).digest()
    return base64.b64encode(hmac_str)


# 官方的权限验证、以及调用接口的参数
def call_asr_offical(the_sound_base64):
    # 注意调用此函数, 电脑不能开启翻墙代理(例如v2Ray), 否则报错!
    endpoint = "asr.tencentcloudapi.com"
    # 输入参数见: https://cloud.tencent.com/document/product/1093/35646
    data = {
        'Action': 'SentenceRecognition',        # 接口
        'ProjectId': '0',
        'SubServiceType': '2',          # 子服务类型。2一句话识别。
        'EngSerViceType': '16k_zh',         # 16k_zh：16k 中文普通话通用。 音频时长不能超过60s，音频文件大小不能超过3MB。
        'SourceType': '1',              # 语音数据来源。0：语音 URL；1：语音数据（post body）
        'VoiceFormat': 'wav',           # 识别音频的音频格式。mp3、wav。
        'UsrAudioKey': 'session_chang',    # 用户端对此任务的唯一标识，用户自助生成
        # 语音数据，当SourceType 值为1（本地语音数据上传）时必须填写, 值为base64编码的string
        'Data': the_sound_base64,
        # 下面是其他必选公共参数
        # 'Region': 'ap-beijing',       # 本接口不需要传递此参数！
        'Nonce': random.randint(1, 100000),
        'SecretId': secret_id,
        'Timestamp': int(time.time()),
        'Version': '2019-06-14',
    }
    # ------------ 注意这里使用的是POST方法 ------------
    s = get_string_to_sign("POST", endpoint, data)
    data["Signature"] = sign_str(secret_key, s, hashlib.sha1)
    print("Signature: ", data["Signature"])
    # 此处会实际调用，成功后可能产生计费
    # 请求方法为 HTTP POST , Content-Type为"application/json; charset=utf-8"
    headers_dic = {
        "Content-Type": "application/json; charset=utf-8",
    }
    resp = requests.post("https://" + endpoint, data=data, headers=headers_dic)
    # 输出一下拼出来的参数
    print("asr resp:", resp)
    # 输出一下返回, 注意, 如果腾讯接口报错, 可以打断点, resp下的reason属性值, 就是报错原因
    # 是无法执行resp.json()方法的
    print(resp.json())

    # 直接返回腾讯给的原始二进制数据
    rsp_dic = resp.json()
    says_text = rsp_dic["Response"]["Result"]
    return says_text

常城

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
调用腾讯云的语音识别(一句话识别)接口-Python版

浪费了2个多小时去调试，所以记录一下代码。接上文，可以直接利用上一篇文章里，返回的音频数据，再传回给腾讯接口，进行识别。# ################################## Copyright(C) 2012-2017# Environment: python 3.9.7# Package: -# D&P Author By: 常成功# Create Date:
复制链接

扫一扫

专栏目录