基于MFCC特征提取 和SVM的声音识别系统

基于MFCC特征提取 和SVM的声音识别系统

一 MFCC特征提取研究

二 分类识别

MFCC特征提取研究

首先提取mfcc的特征,然后对所有的数据构建特征数据库,然后搭建svm的分类网络,其中需要安装libsvm的工具箱,最后得到数据的诊断结果。

如上

是一个数据进行EMD分解后的数据

分别的过程如下所示(部分代码)

Current IMF  |  #Sift Iter  |  Relative Tol  |  Stop Criterion Hit  

      1      |        3     |     0.057677   |  SiftMaxRelativeTolerance

      2      |        5     |      0.11365   |  SiftMaxRelativeTolerance

      3      |        3     |      0.13767   |  SiftMaxRelativeTolerance

      4      |        3     |       0.1082   |  SiftMaxRelativeTolerance

      5      |        3     |      0.10336   |  SiftMaxRelativeTolerance

然后对于分解后的数据,进行滤波处理,得到上述的结果图

 求解mfcc的特征图

二 分类识别

 采取的是svm的方法,使用了Libsvm的工具箱,得到的数据结果如上。

如果修改参数的数值,可以得到的结果。

很显然的,我们需要配置优秀的svm的参数数值,使得训练的效果最好。

具体源程序见:基于MFCC特征提取和SVM的声音识别系统-Matlab文档类资源-CSDN下载

如有侵权,请联系作者删除。 

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MFCC-SVM语者识别是一种基于声学特征提取机器学习算法的语音识别技术。MFCC(Mel频率倒谱系数)是一种常用的声学特征提取方法,它能够将语音信号转换为一维特征向量,用于描述语音信号的频谱特征。 MFCC-SVM语者识别主要包含以下步骤: 1. 数据准备:收集并准备语音语料库,包括不同说话人的语音样本。 2. 特征提取:对每个语音样本进行MFCC特征提取,将语音信号转换为特征向量。MFCC将语音信号在频域上进行分析,通过梅尔滤波器组提取声音的频谱特征。 3. 特征选择:对提取的MFCC特征进行降维处理,去除冗余信息和噪声,选取最具代表性的特征子集。 4. 训练模型:将特征向量输入支持向量机SVM)分类器进行训练。SVM是一种常用的机器学习算法,它能够根据已知的语音样本进行学习,并构建一个分类模型。 5. 语者识别:使用训练好的SVM分类模型对新的语音样本进行预测和判别,将其归类为特定的语者。 MFCC-SVM语者识别技术在语音识别、语音合成和语音信息处理等领域具有广泛应用。它可以用于多种语音相关任务,如语音识别、语音指令控制、语音验证码等。通过提取语音信号的频谱特征并结合机器学习算法进行训练和分类,可以有效地识别和区分不同说话人的语音信息。该技术在实际应用中,有望提升语音识别的准确性和性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能专属驿站

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值