tensorflow通过提取Mfcc特征+卷积神经网络来实现语音分类

对于商业需求,还有很多需要改进的地方,大家多交流


准备工作

一、python+pycharm+tensorflow的下载与安装以及配置

忠告:不要下载tensorflow2.0以上的版本,因为tensorflow1.0版本的很多方法tensorflow2.0都不用了,而且网上有关的资料都是tensorflow1.版本,tensorflow2.0的资料很少,你报错的话,百度出来的博客都是让你改成低版本的;

1、pyhon的安装以及环境的配置

2、Anaconda下载以及安装教程

3、python与Ananconda版本的对应关系如下

4、下载pycharm软件,这个软件是python语言编写的软件,建议下载破解版本的

5、pycharm软件里面如何配置tensorflow

6、如何查看安装的tensorflow的版本

https://blog.csdn.net/qq_37591637/article/details/102782233

7、所有模块的安装都在这个里面进行

第一步、激活环境,只要第一次打开这个窗口就要输入activate tensorflow

第二步、做其他操作,由于大家刚开始都没有安装numpy等等模块,运行程序会报错,举个例子你就明白了

运行程序,报错,没有tensorflow_datasets这个模块,怎么办?我们需要安装

pip install tensorflow-datasets

 

注意:如果安装不成功,多半是因为与国外服务器连接信号差,连接不上,可以试试从国内下载,点解决方案


 二、文件部分

足够多的.wav文件,如果.wav文件少的话。就会导致训练的模型太过于苛刻,那么测试其他文件的时候准确率就很低了;

网上很多资源下载都要6.9G,下载网速很慢;而且训练起来也要十几天的时间!

我的训练文件只有四类,每类里面100个文件;本次语音识别的文件在这里

https://download.csdn.net/download/qq_37591637/12106150

 

原理介绍

1、训练文件,一般是.wav文件,为什么是.wav文件,因为.wav文件占存储空间小,而且无损坏丢失;

2、无论是语音识别还是语音分类,想要训练精度高的模型,你要知道以下的名词是干什么用的,你不用推算原理!

     mfcc特征

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_37591637

请给我持续更新的动力~~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值