ctc
算法工程师000001
生命不息,奋斗不止。
展开
-
语音识别系列6-语音识别CTC之tensorflow前向计算
语音识别系列6-语音识别CTC之tensorflow前向计算一、介绍根据上一节的介绍,我们的模型就训练好了,但是如何使用模型呢,这一节我们进行介绍,模型训练完后,会在模型保存目录下生成至少四个文件,分别为:checkpoint、model.ckpt-*.data-00000-of-00001、model.ckpt-*.index、model.ckpt-*.meta二、源码解析...原创 2019-05-20 15:39:16 · 833 阅读 · 0 评论 -
语音识别系列1--语音识别CTC之数据准备
语音识别CTC之数据准备一、简介CTC是一种端到端的神经网络训练方法,在语音识别领域应用非常广泛,和传统的语音识别HMM相比,CTC省略了数据对齐,特征选取的过程。传统的HMM在训练神经网络之前需要选择特定的语音特征,比如FBANK、MFCC。而CTC则直接将语音转到频域即可使用,传统的HMM在训练之前需要对数据进行帧对齐,对齐的过程首先要进行HMM-GMM的聚类,并且较小的建模粒度需要做...原创 2019-05-17 11:15:25 · 1983 阅读 · 2 评论 -
语音识别系列4--语音识别CTC之模型训练源码解析
一、介绍上一节我们简单介绍了CTC及数据准备过程,做好了数据准备,本节我们介绍CTC模型训练及源码解析。CTC(Connectionist Temporal Classification)连接时间分类,直观上理解,循环神经网络(RNN)更适合于CTC训练,关于CTC的原理上的介绍,大家已经写的很多了,本节我们主要从代码着手,帮助大家从零搭建CTC-ASR训练系统。既然是系统,我们就让代码的...原创 2019-05-18 11:46:01 · 3585 阅读 · 5 评论 -
语音识别系列7-chain model 之分子部分
一、简介现在有越来越多的公司和团体开始使用chain model了,得益于kaldi社区日益活跃和kaldi作者povey的大力推荐,chain model的优越性在于:1,使用了单状态的biphone,建模粒度更大,有些类似于CTC;2,采用的低帧率策略,DNN每三帧输出一次,解码速度更快;3,使用了区分性训练,准确率更高;4,改进了MMI,提出了Lattice free MMI,训练速度更...原创 2019-06-01 14:31:21 · 1358 阅读 · 0 评论