自组织神经网络元音识别

本文介绍了一种使用自组织神经网络进行元音识别的方法。首先通过Cool Edit Pro软件采集.wav格式的语音样本,接着利用Matlab提取MFCC特征参数,然后进行特征参数处理,包括端点识别和数据转换。最后,使用MATLAB的selforgmap函数对数据进行分类,实验结果显示准确率为93%。
摘要由CSDN通过智能技术生成

自组织神经网络元音识别

一、声音数据采集

语音信号的采集工作通过是Cool Edit Pro V2.1软件实现。文件为.wav音频格式,采样频率选择44.1kHz,采样编码数为8,声道为单声道。
实验中语音样本分别取自6人,实验要求每人对a,e,i,o,u五个元音字母进行依次朗读,根据录入数据建立6组,一共30个孤立声音样本。
下图其中一段语音波形:
语音波形图

二、MFCC特征参数提取

基于Matlab的MFCC特征参数提取函数可以参考:

https://cn.mathworks.com/matlabcentral/fileexchange/32849-htk-mfcc-matlab?s_tid=srchtitle

对于MFCC通俗易懂点的理解可以参考:

http://blog.csdn.net/zouxy09/article/details/9156785/

更深入点的理解可以参考:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值