搭建智能语音助手思路整理

最新推荐文章于 2024-05-22 22:21:04 发布

a昊学

最新推荐文章于 2024-05-22 22:21:04 发布

阅读量2k

点赞数 2

文章标签：语音识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49269330/article/details/120244598

版权

目录

搭建一个智能语音助手可以大致分为一下几个模块

唤醒模块
录音模块
语音转文字
对话机器人
文字转语音
播放模块
主体控制模块

唤醒模块

唤醒唤醒模块一旦唤醒，暂时就不工作，唤醒工作结束后继续工作
唤醒之后检查网络状态

待选方案

snowboy

录音模块

一定时间内没有说话自动关闭，系统继续进入等待唤醒状态
一定时间内还在讲话，需要继续录音

录音时间过长提示用户暂停录音，否则继续下一步
录制完成的音频储存为wav格式，录音完成后录音模块停止工作

预选方案

Respeaker USB Mic Array + pyaudio

语音转文字

出错后根据不同的错误做出反馈，主要的错误有

返回空字符
网络错误
预选方案

百度语音识别 or 讯飞语音识别（免费调用量较多）

对话机器人

上传文字之后对话机器人会返回相应的文字，错误的处理同语音转文字部分相同

预选方案

tuling机器人 or 百度机器人

文字转语音

将对话机器人返回的文字转换成语音，主要涉及语音合成技术，百度讯飞等都有相应的api

预选方案

百度语音识别 or 讯飞语音识别（免费调用量较多）

播放模块

将语音播放出来

预选方案

扩音器

主体控制模块

当对话机器人回应唤醒人的时候是否进入下一轮的录音状态，或者是返回待唤醒状态
接入外设时可以从语音识别的文字中查询对应的关键字，然后处理

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。