python调用百度语音api_python通过调用百度api实现语音识别（超详细）

最新推荐文章于 2024-08-01 10:33:26 发布

馍菌

最新推荐文章于 2024-08-01 10:33:26 发布

阅读量1.2k

点赞数

文章标签： python调用百度语音api

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35400275/article/details/112957934

版权

本文详细介绍了如何使用Python结合百度语音API实现语音识别功能。通过PyAudio录音，将wav文件发送到百度服务器进行识别，再根据识别结果打开相应网页。涉及的模块包括PyAudio、wave、requests等，代码包含录音、获取token、语音识别和浏览器操作等步骤。

摘要由CSDN通过智能技术生成

最近在学习python，做一些python练习题

github上几年前的练习题

有一题是这样的：

使用 Python 实现：对着电脑吼一声,自动打开浏览器中的默认网站。

例如，对着笔记本电脑吼一声“百度”，浏览器自动打开百度首页。

然后开始search相应的功能需要的模块(windows10)，理一下思路：

本地录音

上传录音，获得返回结果

组一个map，根据结果打开相应的网页

所需模块：

PyAudio：录音接口

wave：打开录音文件并设置音频参数

requests：GET/POST

为什么要用百度语音识别api呢？因为免费试用。。

不多说，登录百度云，创建应用

查看文档REST API文档

文档写的蛮详细的，简单概括就是

可以下载使用SDK

不需要下载使用SDK

选择2.

根据文档组装url获取token

处理本地音频以JSON格式POST到百度语音识别服务器，获得返回结果

语音格式

格式支持：pcm(不压缩)、wav(不压缩，pcm编码)、amr(压缩格式)。推荐pcm 采样率：16000 固定值。编码：16bit 位深的单声道。

百度服务端会将非pcm格式，转为pcm格式，因此使用wav、amr会有额外的转换耗时。

保存为pcm格式可以识别，只是windows自带播放器识别不了pcm格式的，所以改用wav格式，毕竟用的模块是wave?

首先是本地录音

import wave

from pyaudio import PyAudio, paInt16

framerate = 16000 # 采样率

num_samples = 2000 # 采样点

channels = 1 # 声道

sampwidth = 2 # 采样宽度2bytes

FILEPATH = 'speech.wav'

def save_wave_file(filepath, data):

wf = wave.open(filepath, 'wb')

wf.setnchannels(channels)

wf.setsampwidth(sampwidth)

wf.setframerate(framerate)

wf.writeframes(b&#

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。