bangdan0851-CSDN博客

转载 1-GMM-HMMs语音识别系统-框架篇

本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。Outline:识别原理统计学模型系统框架首先需要说明本文讨论的对象是连续语音识别（Continuous Speech Recognition, CSR），意味着基于DTW（动态时间规整）的孤立词识别（Isolated Word Recognition）不在讨论范围内（out-of-date）。同时，整篇围绕自...

2017-05-06 20:26:00 296

转载 2-GMM-HMMs语音识别系统-训练篇

本文记录在传统的语音识别中，训练GMM-HMMs声学模型过程中的公式推导过程。OutlineGMM - 混合高斯模型HMM – 隐马尔科夫模型Forward-Backward Algorithm – 前向后向算法首先假设这里的训练数据，都做好了音素层面标记的（Label），即utterance的音素边界是已知的。这样做是为了更好地说明和对应我们的H...

2017-04-23 20:04:00 397

转载 3-GMM-HMMs语音识别系统-解码篇

本文主要描述基于GMM-HMMs传统语音识别的解码过程。Outline：Viterbi decodingCross-word decodingBeam search1.Viterbi decoding语音识别就是一个解码/搜索的过程。即由X=xT1=x1x2,⋯,xt,⋯,xt，找到最有可能的单词序列：W∗=argmaxWP(X|W...

2017-04-23 10:11:00 263

转载 5-基于决策树的状态绑定

本文会讨论关于context-dependent model的优化——基于决策树的状态绑定（Tree-based state tying）。Outline：Context-dependent modelTree-based state tying1. Context-dependent model在《GMM-HMMs语音识别系统》中，默认的建模单...

2017-04-21 10:05:00 290

转载 4-Embedded Training

在《GMM-HMMs语音识别系统-训练篇》中，默认的训练数据都是进行了手工音素标记的。然而手工分段的数据非常昂贵，400倍于数据时间（1小时的语音，需要400小时的标记时间），同时手工标记时很难找准音素边界。实际上，语音识别系统在训练每个phone HMM时，是嵌入到整个句子（对整个句子训练），让训练程序自动地找到分割和对齐音素。这种完全自动的声学模型训练方式就被称...

2017-04-19 13:16:00 238

转载 GTX1050 Ti(notebooks)+Ubuntu16.04上安装Cuda8.0

本文主要总结了我在笔记本电脑上安装cuda8.0的过程和经验。配置清单硬件：惠普笔记本（GTX1050 ti）系统：Ubuntu1 16.04.01 64位常见安装方法： .run包（本地）、.deb包（本地）、deb（在线）、集群（本地）。建议：采用第一种方式。.run包里已经包含了显卡驱动、cuda tools、samples例子程序。理论上...

2017-04-10 20:34:00 277

bangdan0851的博客