树莓派使用实时语音流实现语音识别

本文介绍了如何利用树莓派和外置USB声卡实现实时语音识别。在面临树莓派自带声卡无法支持实时语音流的问题时,作者选择了禁用内置声卡,并详细描述了这一过程。通过这种方式,成功移植了语音识别SDK,实现了初步的实时语音流识别,但默认声卡配置和实际应用效果仍有待进一步优化。
摘要由CSDN通过智能技术生成

实时语音流

树莓派之前的语音识别模块是通过识别录制文件工作的,录制音频文件使用的是USB麦克风,效率相对比较低。树莓派自带的声卡是不具备实时语音流的功能的,甚至不具备录制音频的功能。所以需要购置另外的声卡进行语音的交互功能。

使用材料

目前所使用的声卡的型号以及麦克风和扬声器的类型。声卡采用的是耳麦分离款免驱动USB声卡,麦克风和扬声器都是3.5mm接口,其中扬声器另外接USB进行供电。
在这里插入图片描述
初始时遇到的问题是因为树莓派默认声卡设置不成功,预计的效果的是使用外置声卡可以进行实时语音识别的功能,但是将外置声卡设置为默认声卡时总是失败。我所参考过的教程有树莓派声卡配置问题修改默认USB声卡输出,以及配置声卡

禁用自带声卡

由于修改默认声卡总是失败,所以我换了一种思路,比较暴力地将树莓派中的内置声卡禁用,最终实现的效果还不错。
在新的树莓派上重新移植了语音识别SDK,经过检验识别效果还不错。
在这里插入图片描述

总结

  • 通过禁用自带声卡初步实现了实时语音流的效果,识别效果还可以。
  • 默认声卡的配置还有待进一步探究
  • 实时语音流对机器狗的控制效果还有待进一步实验
  • 2
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值