对于商业需求,还有很多需要改进的地方,大家多交流
准备工作
一、python+pycharm+tensorflow的下载与安装以及配置
忠告:不要下载tensorflow2.0以上的版本,因为tensorflow1.0版本的很多方法tensorflow2.0都不用了,而且网上有关的资料都是tensorflow1.版本,tensorflow2.0的资料很少,你报错的话,百度出来的博客都是让你改成低版本的;
4、下载pycharm软件,这个软件是python语言编写的软件,建议下载破解版本的
6、如何查看安装的tensorflow的版本
https://blog.csdn.net/qq_37591637/article/details/102782233
7、所有模块的安装都在这个里面进行
第一步、激活环境,只要第一次打开这个窗口就要输入activate tensorflow
第二步、做其他操作,由于大家刚开始都没有安装numpy等等模块,运行程序会报错,举个例子你就明白了
运行程序,报错,没有tensorflow_datasets这个模块,怎么办?我们需要安装
pip install tensorflow-datasets
注意:如果安装不成功,多半是因为与国外服务器连接信号差,连接不上,可以试试从国内下载,点解决方案
二、文件部分
足够多的.wav文件,如果.wav文件少的话。就会导致训练的模型太过于苛刻,那么测试其他文件的时候准确率就很低了;
网上很多资源下载都要6.9G,下载网速很慢;而且训练起来也要十几天的时间!
我的训练文件只有四类,每类里面100个文件;本次语音识别的文件在这里
https://download.csdn.net/download/qq_37591637/12106150
原理介绍
1、训练文件,一般是.wav文件,为什么是.wav文件,因为.wav文件占存储空间小,而且无损坏丢失;
2、无论是语音识别还是语音分类,想要训练精度高的模型,你要知道以下的名词是干什么用的,你不用推算原理!
mfcc特征