基于 python 的语音识别 API 调用

最新推荐文章于 2025-03-06 18:43:57 发布

MoussaTintin

最新推荐文章于 2025-03-06 18:43:57 发布

阅读量6k

点赞数 4

分类专栏：原创编程语言人工智能语音技术

本文链接：https://blog.csdn.net/JackyTintin/article/details/80003146

版权

本文介绍了如何使用Python调用腾讯AI开放平台的语音识别接口，涵盖了准备工作、接口鉴权、哈希和签名的实现，以及整段语音和AI Lab流式语音识别的调用方法。通过示例代码展示了接口的使用，并提到了接口要求和测试细节。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

腾讯 AI 开放平台开放了语音、图像等多种 AI 功能接口。本文尝试基于 python 完成对语音识别接口的本地调用。

1. 准备工作

API 调用需要身份认证。我们首先需要注册并获得 AppID 和 AppKey。

在官网注册后，进入控制台，创建一个新应用，并在接口选择栏，为应用勾选“语音识别”。应用创建成功后，记下 AppID 和 AppKey。

2. 接口鉴权

接口鉴权的要求见官方说明。为完成鉴权，我们需要定义一些辅助函数，代码见这里。

2.1 哈希

认证需要用到 MD5 哈希算法，这里我们调用 hashlib 库的实现。

import hashlib

def md5(string):
    md = hashlib.md5()
    md.update(string)
    md5 = md.hexdigest().upper()
    return md5

2.2 签名

认证要求使用包括 AppKey 在内的参数拼接字符串的 MD5 值做为签名，其中 AppKey 要位于字条串最后：

def signify(args, app_key):
    query_str = urlencode(args)
    query_str = query_str + '&app_key=' + app_key
    signiture = md5(query_str)
    return signiture

参数需要按键值排序，实现如下：

import urllib

def urlencode(args):
    tuples = [(k, args[k]) for k in sorted(args.keys()) if args[k]]
    query_str = urllib.urlencode(tuples)
    return query_str