tensorflow通过提取Mfcc特征+卷积神经网络来实现语音分类

最新推荐文章于 2025-03-06 17:03:33 发布

qq_37591637

最新推荐文章于 2025-03-06 17:03:33 发布

阅读量1w

点赞数 6

分类专栏：人工智能之深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37591637/article/details/104000526

版权

对于商业需求，还有很多需要改进的地方，大家多交流

准备工作

一、python+pycharm+tensorflow的下载与安装以及配置

忠告：不要下载tensorflow2.0以上的版本，因为tensorflow1.0版本的很多方法tensorflow2.0都不用了，而且网上有关的资料都是tensorflow1.版本，tensorflow2.0的资料很少，你报错的话，百度出来的博客都是让你改成低版本的；

1、pyhon的安装以及环境的配置

2、Anaconda下载以及安装教程

3、python与Ananconda版本的对应关系如下

4、下载pycharm软件，这个软件是python语言编写的软件，建议下载破解版本的

5、pycharm软件里面如何配置tensorflow

6、如何查看安装的tensorflow的版本

https://blog.csdn.net/qq_37591637/article/details/102782233

7、所有模块的安装都在这个里面进行

第一步、激活环境，只要第一次打开这个窗口就要输入activate tensorflow

第二步、做其他操作，由于大家刚开始都没有安装numpy等等模块，运行程序会报错，举个例子你就明白了

运行程序，报错，没有tensorflow_datasets这个模块，怎么办？我们需要安装

pip install tensorflow-datasets

注意：如果安装不成功，多半是因为与国外服务器连接信号差，连接不上，可以试试从国内下载，点解决方案

二、文件部分

足够多的.wav文件,如果.wav文件少的话。就会导致训练的模型太过于苛刻，那么测试其他文件的时候准确率就很低了；

网上很多资源下载都要6.9G，下载网速很慢；而且训练起来也要十几天的时间！

我的训练文件只有四类，每类里面100个文件；本次语音识别的文件在这里

https://download.csdn.net/download/qq_37591637/12106150

原理介绍

1、训练文件，一般是.wav文件，为什么是.wav文件，因为.wav文件占存储空间小，而且无损坏丢失；

2、无论是语音识别还是语音分类，想要训练精度高的模型，你要知道以下的名词是干什么用的，你不用推算原理！

mfcc特征

最低0.47元/天解锁文章

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

qq_37591637 请给我持续更新的动力~~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。