自组织神经网络元音识别

最新推荐文章于 2024-07-30 14:24:53 发布

Archer_Jin

最新推荐文章于 2024-07-30 14:24:53 发布

阅读量1.2k

点赞数

分类专栏：神经网络文章标签：神经网络 matlab 元音识别 MFCC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Archer_Jin/article/details/51867229

版权

本文介绍了一种使用自组织神经网络进行元音识别的方法。首先通过Cool Edit Pro软件采集.wav格式的语音样本，接着利用Matlab提取MFCC特征参数，然后进行特征参数处理，包括端点识别和数据转换。最后，使用MATLAB的selforgmap函数对数据进行分类，实验结果显示准确率为93%。

摘要由CSDN通过智能技术生成

自组织神经网络元音识别

一、声音数据采集

语音信号的采集工作通过是Cool Edit Pro V2.1软件实现。文件为.wav音频格式，采样频率选择44.1kHz，采样编码数为8，声道为单声道。
实验中语音样本分别取自6人，实验要求每人对a，e，i，o，u五个元音字母进行依次朗读，根据录入数据建立6组，一共30个孤立声音样本。
下图其中一段语音波形：
语音波形图

二、MFCC特征参数提取

基于Matlab的MFCC特征参数提取函数可以参考：

https://cn.mathworks.com/matlabcentral/fileexchange/32849-htk-mfcc-matlab?s_tid=srchtitle

对于MFCC通俗易懂点的理解可以参考：

http://blog.csdn.net/zouxy09/article/details/9156785/

更深入点的理解可以参考：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。