人类可以听到的音频信号频段范围在20kHz以下。本系统为了减少功耗,提高语音质量。添加了语音识别算法,可以实时识别当前音频是人声,音乐,或者是噪声。如果是噪声,则会关闭扬声器输出,降低系统功耗。
基本思路
第一步,对输入进来的音频信号进行分帧处理,分为不同的时间片。
第二步,对每个时间片数据进行短时傅里叶分析,分析出其频域信息。
第三步,使用梅尔滤波器对频域信息进行特征提取。
第四步,将提取到的结果进行FIR滤波,提高识别的稳定性
第五步,生成合适的滤波器,去除噪声,保留正常的语音信号
人声提取测试结果
本系统将一段音频进行噪声去除处理,图4.16,图4.17,图4.18分别为语音特征提取,语音阈值自适应结果,以及生成的实时滤波器参数。
语音原信号
图4.16 语音特征提取
图4.17 语音阈值自适应
图4.18 生成实时滤波器参数
由图4.18可知,该算法可以很好的去除噪声,保留人声信息。