测试 | 车载智能座舱基础知识

1.VAD(voice activity detection)语音活动检测

也称为静音检测,是用来判断用户是否已经说完话,然后通过结果判断是否进行回答。

开始语音识别之前,把首尾端的静音切除,以防对后续步骤进行干扰。

如果此时用户还没有说完话,就停止识别了开始回答,会造成理解不当,回答不精准的情况;但是如果用户已经说完话了,过长的识别,从说完话到回答的时间过长,会造成用户体验感不佳的情况,所以VAD的目的是用来识别和消除语音信号中长时间的静音期。

静音检测分为前端VAD和后端VAD:

前端VAD:

  • 从用户唤醒语音后多久没有说话就认为用户不想说话

后端VAD:

  • 从用户说完话后多久没有说话就认为用户不想说话

静音检测超时,可能是周围人声的影响,也可能是引擎的问题,需要分析pcm录音文件和日志。

VAD的优点:

  • 提高语音信号的利用率
  • 减少语音信号的冗余信息
  • 提高语音识别的准确率和效率

2.ASR(automatic speech recognize)语音识别

是把识别到的声音转换为文字的过程,让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。相当于耳朵👂

语音识别的原理主要包括三

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值