\qquad 这是三种语音唤醒的处理方法。VAD(Voice Activity Detection 语音激活检测)是用于检测当前输入信号中是否有语音的技术。VAD一般会综合分析输入信号的能量特征,以及频谱特征等信息判断是否存在语音。
\qquad 由这两段话的分析可知,HW-VAD的功耗更低,因为这种方法,平时是处于低功耗状态,等到被唤醒之后才开始高耗电。而不像SW-VAD那样,需要一直保持着运行状态才可以处理任务。
\qquad
理论上来说,StandBy模式下的功耗是更低的,但是从实际的使用效果来看,使用的更多的还是HW-VAD模式,因为虽然Standby的功耗更低,但是由于该模式下的大部分区域都处于掉电状态,因为唤醒时间是毫秒(ms)级别的,但是HW-VAD模式,只需要开启时钟,即可唤醒,时间是微秒级别的,更快。standby模式会大大的降低用户的使用体验。唤醒时间达到几十毫秒以后,会产生如下问题: 1.增加设备的唤醒时间,影响客户对设备反应速度的感受; 2.唤醒时间内用户说的语音会丢失,处理器的“关键字识别(Keyword Spotting)”的识别率会降低,即降低正确唤醒设备的概率。严重时,客户必须说两次才能唤醒设备,影响客户体验。