使用百度语音API实现语音转文本识别(测试结果非常好,可以用来玩玩)--python实现

本文介绍了如何在Python环境下使用百度语音API进行语音转文本识别。首先,详细阐述了系统环境和所需的Python依赖包。接着,解释了申请百度语音API并获取API Key和Secret Key的步骤。在代码实现部分,提供了语音识别的Python代码示例,并展示了成功识别华为手机.m4a格式录音文件的结果。最后,提到了用此技术实现智能语音助理的可能性。
摘要由CSDN通过智能技术生成

系统环境

python 3.7

windows 10

一些python依赖包使用pip install 安装即可,出现报错时用conda install 一般均可以正确安装

百度语音API与讯飞语音API使用方式几乎一致,也可使用讯飞语音API

整个百度语音识别api 使用分为三部分:
1 (申请操作)创建应用,获取应用的 API Key 以及 Secret Key。
2 (程序实现)通过已知的 应用的 API Key 以及 Secret Key, 发送post 请求到 https://openapi.baidu.com/oauth/2.0/token 获取 token
(程序实现) 通过上步骤获取的 token,通过post, 发送相关的语音信息到 http://vop.baidu.com/server_api ,获取识别结果.

实现步骤

**

一、申请百度语音AI平台账号

进入百度语音识别AI网站 百度语音AI网站

点击立即使用进入登录注册界面,按顺序操作即可,登录百度账号即可。
在这里插入图片描述
然后选择创建应用,创建完成后会有专属于自己的API key与Screct Key,这些在下面python代码里会用到,需要改为自己的key。
在这里插入图片描述
二、python实现语音识别
代码部分来自于CSND博客,看代码中一些print输出应该是北京邮电大学的学生,但关闭网页后找不到原文,若有侵权,请联系。

import urllib.request
import urllib
import json
import base64
class BaiduRest:
    def __init__(self, cu_id, api_key, api_secert):
        # token认证的url
        self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
        
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值