MFCC & PLP
最新推荐文章于 2023-07-28 14:58:40 发布
本文介绍了MFCC(梅尔频率倒谱系数)和PLP(感知线性预测)两种常用的语音特征提取方法,用于语音/说话人识别。MFCC包括预加重、分帧、加窗、STFT、三角带通滤波器、离散余弦变换等步骤,模拟人类听觉系统。PLP则尝试模拟人耳对频率和响度的非线性响应,以提高识别率。
摘要由CSDN通过智能技术生成