自动语音识别(ASR)系统在日常生活中的应用越来越广泛,影响ASR性能的主要因素。语种、语速及口音,背景噪声,信噪比等。因此,必须针对各种因素进行测试,同时测试场景可复现。 标准化测试展示 GB/T 36464 智能交互系统 测试分类: 车载终端 智能家居 智能客服 移动终端 测试内容: 响应时间 声纹识别 语义识别 唤醒率和误唤醒 语音识别系统 由于对语音识别的需要来自不同的领域和部门,因此对语音识别系统应具有的性能和指标提出了差异极大的要求,语音识别系统要根据一定的指标、要求设计。因此有必要讨论系统设计过程中要考虑的各种因素、语音识别系统的基本结构以及系统的设计方略和步骤。语音识别系统的设计要考虑到服务对象、词表大小、工作环境、发音方式等许多因素, 语音识别系统的原理框图: 语音输出特点 • 音频文件格式:音源使用 wav 格式的音频文件 • 多通道输出:最多支持 8 个人工嘴同时输出。 • 归一化输出:配置好人工嘴均衡文件后,所有音频文件输出声压在 MRP 处为 -4.7dBPa ,无需手动调整音频文件及人工嘴功放。 输出调整:支持语速调节和输出声压调节。 实现语音识别的关键技术 语音识别的关键技术包括特征参数提取技术、模式匹配准则及模型训练技术、语音技术单元选取。本文主要讨论语音识别算法及语音特征参数提取。