用神经网络实现语音分类

最新推荐文章于 2024-06-25 10:25:06 发布

ccc123_ok

最新推荐文章于 2024-06-25 10:25:06 发布

阅读量1.2k

点赞数 1

文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ccc123_ok/article/details/114802958

版权

多个文章介绍了用卷积网络实现语音分类的思想和实现过程, 在数据准备过程中需要关注的一些点总结如下：

1.数据集 urbandsound8K

2.数据分类10

3.基本思路：

3.1) 对音频段计算每帧MFCC

3.2)多个帧MFCC构成时间相关的输入序列

3.3).利用lstm或rnn网络，多mfcc序列进行分类

4.音频预处理

urbandsound8K 数据集中的音频片段采样率，通道数，采样位数有不同，比如48k,44,1K采样，单双通道，16bit，24bit音频均有。故先要统一转换成16K采样，16bit音频和单声道。

4.1）双通道转单通道方法：

4.1.1）仅取某一通道数据（本文取此方法）

4,1.2）取两通道数据平均值

4.2）音频重采样

要考虑不同情况，比如48k转换为16K， 8K转换为16K. 此处采用fft实现音频重采样，最大限度减少过程中的质量损失

4.3）采样位数变化

4.3.1）8比特转16比特。注意8比特音频为无符号数，中值为128，转换到16比特时要减去128再乘以256

4.3.2）24比特转16比特。24比特音频采用小端存储，为有符号数，最大值为2^23.可以先转为【-1，1】之间的32位浮点数，然后再乘以32767变为16比特音频数据

5.mfcc计算

主要是采用fft3w库计算fft,然后计算标准的mfcc值，基本过程为：预加重，加窗，fft变换，计算平方能量值， DCT变换，解卷积，倒谱提升

6.神经网络选择

可以基于CNN也可以基于lstm或rnn.从实际测试情况看，采用cnn网络具有更好的分辨准确率。而加入了mfcc一阶差分的比不加入具有更高的分辨准确率，初步训练后，测试准确率为75%

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
用神经网络实现语音分类

多个文章介绍了用卷积网络实现语音分类的思想和实现过程。由于语音具有较非常好的时序特性，而LSTM.或rnn网络就是为时序相关性的任务而设计的，所以，在此试着用次网络实现语音的分类任务.1.数据集 urbandsound8K2.数据分类103.基本思路：3.1) 对音频段计算每帧MFCC3.2)多个帧MFCC构成时间相关的输入序列3.3).利用lstm或rnn网络，多mfcc序列进行分类4.音频预处理urbandsound8K 数据集中的音频片段采样率，通道数，采样位数有不同
复制链接

扫一扫

ccc123_ok CSDN认证博客专家 CSDN认证企业博客

码龄12年

11: 原创

34万+: 周排名

76万+: 总排名

1万+: 访问

: 等级

308: 积分

4: 粉丝

9: 获赞

8: 评论

30: 收藏

私信

关注

热门文章

最新评论

‘Tensor‘ object has no attribute ‘numpy‘报错解决
CSDN-Ada助手: 恭喜您写了第11篇博客！标题“‘Tensor‘ object has no attribute ‘numpy‘报错解决”非常吸引人。很高兴看到您一直在坚持创作并分享有价值的内容。对于这个报错的解决方法，您的分享无疑给了很多人很大的帮助。接下来，我建议您可以继续分享一些其他常见错误的解决方案，或者深入探讨一些与Tensor相关的主题。期待您的下一篇博客！
用神经网络实现语音分类
灬木子火乐灬: 有源码吗？
YOLO多线程多模型运行模式的实施
happye0: 楼主，请问目前yolov5 多线程和多模型加载你那有进展么？可否提供下思路
YOLO多线程多模型运行模式的实施
ccc123_ok 回复 Michael Cong: darknet代码本身没有做这方面的事情。需要自己添加代码实现多线程模式下的多模型检测.
YOLO多线程多模型运行模式的实施
Michael Cong: 您好。darknet多线程加载两个模型同时检测目标（比如：行人检测，安全帽检测），这个怎么实现。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。