CTC & 语音基础 & GMM & EM Connectionist Temporal Classification (CTC)算法解释https://www.jianshu.com/p/0cca89f64987语音中响度,音调与音色的影响因素https://blog.csdn.net/qq_37385726/article/details/89176142GMM模型与EM算法https://blog.csdn.net...
经典语音论文 经典语音论文:语音合成,语音识别 为主https://github.com/zzw922cn/awesome-speech-recognition-speech-synthesis-papers
语音之特征参数提取 https://blog.csdn.net/w_manhong/article/details/78977833线性预测分析(LinearPredictionCoefficients,LPC)感知线性预测系数(PerceptualLinearPredictive,PLP)Tandem特征和Bottleneck特征基于滤波器组的Fbank特征(Filterbank)线性预测...
机器学习中的熵、条件熵、相对熵和交叉熵(为何使用交叉熵作为损失函数) 信息熵,条件熵,相对熵,交叉熵的定义与意义:https://blog.csdn.net/u013569304/article/details/82595548数据压缩与信息熵:http://www.ruanyifeng.com/blog/2014/09/information-entropy.html...
数据集总结 包含图像语音数据集及项目总结:https://www.jianshu.com/p/d0baf4326ff2各种免费的数据集:https://www.cnblogs.com/genghenggao/p/9625450.html
语音基础知识-基本语音知识,声谱图,log梅普图,MFCC,deltas详解 基本语音知识:https://www.cnblogs.com/liaohuiqiang/p/9916352.html语音特征提取基本知识:https://www.cnblogs.com/liaohuiqiang/p/10159429.html动态时间规整DTW(Dynamic Time Warping)介绍:作用:求解两个不同的时间序列的相似度方法https://blog....
语音识别学习日志 2019-7-17 语音识别基础知识准备6 {维特比算法(Viterbi Algorithm)} HMM 维特比算法(Viterbi Algorithm)详细解释参考:http://www.52nlp.cn/hmm-learn-best-practices-six-viterbi-algorithm-1http://www.52nlp.cn/hmm-learn-best-practices-six-viterbi-algorithm-2http://www.52nlp.cn/hmm-l...
语音识别学习日志 2019-7-16 语音识别基础知识准备5 {决策树算法(ID3、 C4.5、 CART)} 决策树算法(ID3、 C4.5、 CART)决策树的定义决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一颗熵值下降最快的树,到叶子节点处,熵值为0。其具有可读性、分类速度快的优点,是一种有监督学习。决策树呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型;预测时,对新的数据,利用决策模型进行分类。...
语音识别学习日志 2019-7-15 语音识别基础知识准备4 {Baun-Welch算法} HMM 前向算法(Forward Algorithm)详细解释参考:http://www.52nlp.cn/hmm-learn-best-practices-five-forward-algorithm-1http://www.52nlp.cn/hmm-learn-best-practices-five-forward-algorithm-2http://www.52nlp.cn/hmm...
语音识别学习日志 2019-7-14 语音识别基础知识准备3 {Kmean算法分析与HMM(Hidden Markov Model)模型} Kmean算法聚类算法对于"监督学习"(supervised learning),其训练样本是带有标记信息的,并且监督学习的目的是:对带有标记的数据集进行模型学习,从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。对于无监督学习,...
语音识别学习日志 2019-7-14 语音识别基础知识准备2 {EM算法与混合高斯模型(Gaussian mixture model, GMM)} https://blog.csdn.net/lin_limin/article/details/81048411会对GMM和EM做详细介绍本文参考:http://www.ituring.com.cn/article/497545(GMM模型)https://blog.csdn.net/xmu_jupiter/article/details/50889023(GMM模型)http:...
语音识别学习日志 2019-7-13 语音识别基础知识准备 1{语音基础知识} 线性预测线性预测(linear prediction)根据随机信号过去的p个已知抽样值序列为Sn-1,Sn-2,…Sn-p,预测现时样值Sn的估计值的方法。预测公式是一个线性方程,所以这种预测称为线性预测。声音的构成声音频率决定音调;声音振幅决定大小;声音谐波决定音色。之所以能分辨出不同乐器和不同人,只因为声音中谐波成份不同。音强声音的强度是一个客观的物理量,...
CNN(Convolutional Neural Network) 的基础 卷积神经网络(Convolutional Neural Network,简称CNN),是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。卷积神经网络包括卷积层和池化层。卷积神经网络是受到生物思考方式启发的MLPs(多层感知器),它有着不同的类别层次,并且各层的工作方式和作用也不同。CNN网络结构如图所示,CNN网络工作时,会伴随着卷积并且不断转换着这些卷积。学...
机器学习名词解释 1. 损失函数损失函数是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。经验风险:一个损失函数的函数结构风险:可简单理解为经验风险(一种损失函数的函数)+λ正则化项。模型的结构风险函数包括了经验风险项和正则项,通常可以表示...
ubuntu 安装 mysql (1)打开/etc/mysql/debian.cnf文件,在这个文件中有系统默认给我们分配的用户名和密码,通过这个密码就可以直接对mysql进行操作了。但是一般这个密码都比较怪,很长很长。(2)当进入mysql之后修改mysql的密码:这个方法比较好,具体的操作如下用命令:set password for 'root'@'localhost' = password('yourpass');
交叉验证 sklearn中的交叉验证(Cross-Validation)sklearn是利用python进行机器学习中一个非常全面和好用的第三方库,用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法,主要是对sklearn官方文档 Cross-validation: evaluating estimator performance进行讲解,英文水平好的建议读官方文档,里
特征选择 特征选择是特征工程中的重要问题(另一个重要的问题是特征提取),坊间常说:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程尤其是特征选择在机器学习中占有相当重要的地位。通常而言,特征选择是指选择获得相应模型和算法最好性能的特征集,工程上常用的方法有以下:1. 计算每一个特征与响应变量的相关性:工程上常用的手段有计算皮尔逊系数和互信息系数,皮尔逊系数只能衡量
MyBatis3.x和Spring3.x的整合 MyBatis3.x和Spring3.x的整合2017/10/021.mybatis和spring整合的思路1.让spring管理SqlSessionFactory2.让spring管理mapper对象和dao使用spring和mybatis整合开发mapper代理及原始dao接口。自动开启事务,自动管理sqlsession3.让spring管理
MyBatis之查询缓存 MyBatis之查询缓存2017/09/30正如大多数持久层框架一样,MyBatis同样也提供了对查询数据的缓存支持。今后我们要学习的SpringMVC框架属于系统控制层,它也有它的缓存区域,对响应的jsp页面进行缓存;Spring属于系统业务层,它的缓存区域对业务数据进行缓存。而它们三者的缓存区域都存在于用户要访问数据库的中间,当用户向数据库中发送查询请求时,系统会先在它们三者的
MyBatis之使用resultMap实现高级映射 MyBatis之使用resultMap实现高级映射2017/09/30对于数据库中对表的增删改查操作,我们知道增删改都涉及的是单表,而只有查询操作既可以设计到单表操作又可以涉及到多表操作,所以对于输入映射parameterType而言是没有所谓的高级映射的,也就是说高级映射只针对于输出映射(因为高级映射设计到多张表)。前五篇文章我们都只实现了单表中的字段与pojo的映射,而