自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 声学模型学习笔记(七) advanced deep models

multitask and transfer learningmultitask learning:不同的任务网络,可以共享一部分网络结构(比如说某个隐层) transfer learning:迁移学习SHL-MDNN shared-hidden-layer multilingual DNN,用于训练不同语言的模型,所有的模型共享同一个隐层,输出层跟语言有关。 共用的隐层可以认为是一个特征提取

2016-10-08 20:09:03 2103

原创 声学模型学习笔记(六) representation learning

feature representation特征抽象 DNN的前L-1层可以认为是特征提取部分,最后一层认为是简单的分类层。 相比于人工设计的特征(比如MFCC),多层(每一层sigmoid都是一种非线性变换)连接起来具有很强的特征抽象能力。 靠近输入层的表示low-level特征;靠近输出层的表示high-level的特征,high-level的特征更为抽象。 如上图,一个特点是hig

2016-10-08 20:07:23 3397

原创 声学模型学习笔记(五) SDT(MMI/BMMI/MPE/sMBR)

DNN训练使用的CE准则是基于每一帧进行分类的优化,最小化帧错误率,但是实际上语音识别是一个序列分类的问题,更关心的是序列的准确性。所以引入SDT(sequence-discriminative training),训练准则更符合实际,有利于提升识别率。常用的准则包括MMI/BMMI、MPE、MBR等。 准则 目标函数 CE 帧错误率 MMI/BMMI 句子正确率 MPE

2016-10-08 19:58:22 14292 5

原创 声学模型学习笔记(四) dnn speedup

trainingminibatch一般设为256-1024.太小会导致更新参数频繁,降低GPU的计算效率;太大会导致训练需要更多的训练迭代数。piplined bp将模型按层分割,然后分配到不同的GPU机器上面,实现训练的并行。例如下图 一帧数据依次经过三个GPU的前向计算,然后在依次进行后向传播。图中的时刻: - GPU1处理n的前向计算和n-5的bp计算 - GPU2处理n-1的前向计

2016-10-08 19:56:00 1696

原创 声学模型学习笔记(三) DNN-HMM hybrid system

architecture 声学信号使用HMM框架建模,每个状态的生成概率使用DNN替换原来的GMM进行估计,DNN每个单元的输出表示状态的后验概率。decoding实际的语音识别解码的时候使用的是似然概率: w^=argmaxwp(w|x)=argmaxwp(x|w)p(w)/p(x)=argmaxwp(x|w)p(w)\hat{w}=argmax_{w}p(w|x)=argmax_{w}p(x

2016-10-08 19:54:18 15093 2

原创 声学模型学习笔记(二) DNN

trainingtraining criteria1.MSE 对于回归任务,可以使用MSE(mean square error)准则: JMSE(W,b;o,y)=12(vL−y)T(vL−y)J_{MSE}(W,b;o,y)=\frac{1}{2}(v^L-y)^T(v^L-y) yy表示标注结果,vv表示预测结果 2.CE 对于分类任务,可以使用CE(cross-entropy)准则:

2016-10-08 19:51:12 4005

原创 声学模型学习笔记(一) HMM

“声学模型学习笔记”是《automatic speech recognition a deep learning approach》这本书的读书笔记,会有少量的个人理解和公式详细推导,声学入门狗一枚,不具有指导意义,具体以原书和列出的参考文献为准,欢迎指导和讨论。HMM含义Markov Chains马尔科夫链,表示一个状态到另一个状态转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布

2016-10-08 19:45:48 4893

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除