快速原型的智能语音助理应用与树莓派_凯利讯半导体

本文介绍了利用XMOS和Seeed技术的开发工具包,简化Amazon Alexa和谷歌Assistant在树莓派上的集成,以创建智能语音助手原型。文章详细描述了设置和配置过程,以及如何利用这些工具包实现Alexa和谷歌助手的全部功能,为开发人员提供了一条快速原型开发的路径。
摘要由CSDN通过智能技术生成

  由于流行的智能语音产品如Amazon Echo和谷歌Home,语音助手迅速成为一项重要的产品功能。虽然语音服务提供商为开发人员提供了应用程序编程接口(API)支持,因此他们不必成为语音识别和解析方面的专家,但是将音频硬件和语音处理软件结合起来的需求仍然是一个很大的障碍。

  此外,在声学设计、音频工程和基于云的服务方面没有广泛经验的项目可能会在处理与每个规程相关的细节方面遇到重大的延误。

  为了解决这些问题,供应商已经提供了完整的语音助理开发工具包来大大简化问题。这篇文章将介绍两个这样的工具包,一个来自XMOS,一个来自Seeed技术,这两个工具分别支持基于Amazon Alexa Voice Service (AVS)和谷歌Assistant的定制产品的快速开发。这些板子的设计与树莓基础树莓Pi 3 (RPi 3)板相结合。

  这篇文章将描述如何让每个组件运行起来,并展示每个工具包如何使语音助手技术变得容易访问。


  AVS快速评估

  亚马逊推出了一款名为Alexa smart扬声器的产品,该产品提供了一种智能语音助手功能,这种功能在很大程度上仅限于过去的智能手机。对于开发人员来说,AVS API的可用性打开了在定制系统设计中使用这些语音助手的大门,但仍然需要在音频硬件和软件方面的大量专业知识。现在,XMOS xCORE VocalFusion 4-Mic套件为Amazon AVS提供了实现语音助手的最后一块拼图。

  XMOS组件包括一个XVF3000处理器基板,一个100毫米线性阵列的4英飞天IM69D130 MEMS麦克风,xTAGdebugger,安装套件,和电缆。开发人员需要提供RPi 3 a供电的扬声器和USB电源,以及USB键盘、鼠标、显示器和互联网连接。在将XMOS板和麦克风阵列连接到RPi 3后,开发人员可以快速开始评估Amazon Alexa语音助手(图1)。

  XMOS xCORE VocalFusion的图像。

  图1:开发人员开始使用XMOS xCORE VocalFusion工具包,将提供的麦克风阵列板(far left)和XMOS处理器板(中)插入到树莓Pi 3板(右)中。

  将RPi 3连接到USB键盘、鼠标、显示器和互联网服务之后,下一步的步骤是在SD卡上安装Raspbian操作系统,在RPi 3上打开终端,并克隆XMOS VocalFusion存储库。通过安装操作系统和repo,只需运行安装脚本auto_install。sh位于克隆的vocalfusion-avs-setup目录中。

  安装脚本配置树莓Pi音频系统及其与xCORE VocalFusion组件的连接,并安装和配置树莓Pi上的AVS设备SDK。这个安装过程大约需要两个小时完成。

  安装完成后,开发人员需要执行一个简单的程序来加载他们的Amazon developer凭证,并开始测试大量的语音命令和内置功能。在这一点上,XMOS工具包将能够演示Alexa的全套功能,如计时器、警报和日历,以及使用Alexa技能包构建的第三方功能。

  参考设计

  简单的设置过程掩盖了在XMOS工具包中工作的复杂的硬件和软件组件。该工具包为开发人员提供了一个全面的参考设计来实现定制设计。在XMOS工具包的核心,XMOS XVF3000-TQ128设备提供了大量的处理能力(图2)。

  XMOS XVF3000-TQ128设备示意图。


  图2:XMOS XVF3000-TQ128设备集成了两个xCORE tiles,每个都有8个核心,以提供高性能的音频处理。

  该设备用于并行处理任务,包括两个xCORE tiles,每个磁砖包含8个32位的xCORE核心,其中集成了I/O、256 Kbytes的SRAM和8 kb的一次性可编程(OTP)芯片内存。xTIME调度程序管理内核,并触发从I/O引脚到硬件事件的核心操作。依次,每个核心都可以独立地执行计算、信号处理或控制任务,利用xCORE VocalFusion工具包中集成的2MB闪存,并将代码和数据用于工具包的设置和执行。

  XMOS处理器的基板除了XVF3000-TQ128设备之外,还需要额外的组件(图3)。除了基本的缓冲和头部连接,基板还包括一个Cirrus逻辑CS43L21数字-模拟转换器(DAC),用于生成与外部扬声器的输出音频。最后,基板带出XVF3000-TQ128设备的I2C端口,以及音频优化的I2S接口,用于数字音频。

  XMOS组件的底板图包括XVF3000-TQ128设备(点击放大)


  图3:XMOS组件的基板包括XVF3000-TQ128设备、DAC、缓冲器和连接到树莓Pi 3板和外部扬声器的头。

  该组件在XMOS板上的音频处理和RPi 3(图4)上的高级语音处理服务之间的整体功能进行了分割。RPi的Broadcom四核处理器运行软件,分析音频流,以识别和处理与亚马逊的AVS之间的交互。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值