树莓派实现语音识别与语音合成——百度云语音识别API

最新推荐文章于 2024-05-29 20:41:36 发布

置顶

da木木

最新推荐文章于 2024-05-29 20:41:36 发布

阅读量2.9w

点赞数 31

分类专栏：树莓派开发文章标签：树莓派语音识别语音合成

本文链接：https://blog.csdn.net/sinat_35162460/article/details/86544772

版权

本文介绍了如何在树莓派上利用百度云语音识别API进行语音识别和语音合成。首先，申请百度AI开发者账号并安装python-SDK，接着展示SDK的安装与配置。然后，通过SDK实现语音识别，要求音频参数符合16K PCM格式。此外，还演示了SDK的语音合成功能，限制文本长度小于1024字节。最后，提供了github链接以获取更多项目信息。

摘要由CSDN通过智能技术生成

本文采用百度云语音识别API接口，实现低于60s音频的语音识别，也可以用于合成文本长度小于1024字节的音频，此外采用snowboy离线语音唤醒引擎可实现离线语音唤醒，实现语音交互。基于本内容可实现语音控制小车，语音控制音箱、语音交互。。。
可以查看我的github获取更多信息：https://github.com/dalinzhangzdl/AI_Car_Raspberry-pi
一、百度云语音识别 python-SDK的安装
工欲善其事必先利其器，下面先来武装一下自己，申请属于自己的百度AI开发者账号，安装SDK（Software Development Kit，软件开发工具包）。
1、进入百度云平台，进入百度语音控制台后，创建自己的应用，获取属于你的ID号和密钥：
APP_ID = ‘114xxxx5’
API_KEY = ‘NYIvd23qqGAZxxxxxxxxxxxxxxx’
SECRET_KEY = ‘DcQWQ9Hxxxxxxxxxxxxxxxxxxxxxx’
2、SDK的下载与安装
应用创建完成后下载相应的开发SDK，这里采用python开发，下载python-SDK即可
在这里插入图片描述
SDK的安装：
将下载的SDK包拷贝到树莓派pi目录下，终端界面解压安装，安装过程如下：