KWS
图灵与对话
我打赏了很多小红花。
展开
-
Convolutional Recurrent Neural Networks for Small-Footprint Keyword Spotting 卷积递归神经网络的小脚印关键词发现
Abstract 关键字发现(KWS)构成了人机界面的主要组成部分。 KWS的目标是在低虚警(FA)率下最大化检测精度,同时最小化占用空间,延迟和复杂性。 为了实现它们,我们研究了卷积递归神经网络(CRNN)。 受大规模先进语音识别系统的启发,我们结合了卷积层和递归层的优势,以利用局部结构和远程上下文。 我们分析了架构参数的影响,并提出了提高性能的培训策略。 仅需约230k参数,我们的CRNN模...翻译 2020-02-11 21:43:42 · 918 阅读 · 0 评论 -
Attention-based End-to-End Models for Small-Footprint Keyword Spotting基于注意的小脚印关键字点对点模型
Abstract 在本文中,我们提出了一种基于注意力的端到端神经网络方法,用于小足迹关键词发现(KWS),旨在简化构建生产质量的KWS系统的流程。我们的模型包括一个编码器和一个注意机制。编码器使用RNN将输入信号转换为高级表示。然后,注意力机制对编码器特征进行加权,并生成固定长度的向量。最后,通过线性变换和softmax函数,向量成为用于关键字检测的得分。我们还评估了不同编码器架构(包括LSTM...翻译 2020-02-06 17:01:57 · 1825 阅读 · 2 评论 -
A FAR-FIELD TEXT-DEPENDENT SPEAKER VERIFICATION DATABASE AND THE BASELINES
远距离文本相关的说话人验证数据库和基准 Abstract 本文介绍了一个名为HI-MIA的大型远场相关文本说话者验证数据库。 我们的目标是满足基于远场麦克风阵列的扬声器验证的数据要求,因为大多数公开可用的数据库都是单个通道近距离对话且与文本无关。 我们的数据库包含针对远场方案设计的房间中340人的记录。 通过位于不同方向和距离扬声器的多个麦克风阵列和一个高保真近距离麦克风来捕获录音。 此外,我...翻译 2020-02-05 10:52:06 · 888 阅读 · 0 评论 -
An End-to-End Architecture for Keyword Spotting and Voice Activity Detection《端到端框架的语音唤醒词识别检测》
Abstract 我们提出了一个单一的神经网络架构来完成两项任务:在线关键词发现和语音活动检测。 我们开发了一种新的推理算法,用于使用Connectionist临时分类损失函数训练的端到端递归神经网络,该模型使我们的模型无需重新训练即可在关键词识别和语音活动检测上实现高精度。 与以前的语音活动检测模型相比,我们的体系结构不需要对齐的训练数据,并且使用与关键字发现模型相同的参数。 这使我们能够部署...翻译 2020-01-29 14:20:33 · 1328 阅读 · 0 评论