自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 1-GMM-HMMs语音识别系统-框架篇

本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。 Outline: 识别原理 统计学模型 系统框架 首先需要说明本文讨论的对象是连续语音识别(Continuous Speech Recognition, CSR),意味着基于DTW(动态时间规整)的孤立词识别(Isolated Word Recognition)不在讨论范围内(out-of-date)。同时,整篇围绕自...

2017-05-06 20:26:00 237

转载 2-GMM-HMMs语音识别系统-训练篇

本文记录在传统的语音识别中,训练GMM-HMMs声学模型过程中的公式推导过程。 Outline GMM - 混合高斯模型 HMM – 隐马尔科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假设这里的训练数据,都做好了音素层面标记的(Label),即utterance的音素边界是已知的。这样做是为了更好地说明和对应我们的H...

2017-04-23 20:04:00 348

转载 3-GMM-HMMs语音识别系统-解码篇

本文主要描述基于GMM-HMMs传统语音识别的解码过程。 Outline: Viterbi decoding Cross-word decoding Beam search 1.Viterbi decoding 语音识别就是一个解码/搜索的过程。即由X=xT1=x1x2,⋯,xt,⋯,xt,找到最有可能的单词序列: W∗=argmaxWP(X|W...

2017-04-23 10:11:00 227

转载 5-基于决策树的状态绑定

本文会讨论关于context-dependent model的优化——基于决策树的状态绑定(Tree-based state tying)。 Outline: Context-dependent model Tree-based state tying 1. Context-dependent model 在《GMM-HMMs语音识别系统》中,默认的建模单...

2017-04-21 10:05:00 240

转载 4-Embedded Training

在《GMM-HMMs语音识别系统-训练篇》中,默认的训练数据都是进行了手工音素标记的。然而手工分段的数据非常昂贵,400倍于数据时间 (1小时的语音,需要400小时的标记时间),同时手工标记时很难找准音素边界。实际上,语音识别系统在训练每个phone HMM时,是嵌入到整个句子(对整个句子训练),让训练程序自动地找到分割和对齐音素。这种完全自动的声学模型训练方式就被称...

2017-04-19 13:16:00 192

转载 GTX1050 Ti(notebooks)+Ubuntu16.04上安装Cuda8.0

本文主要总结了我在笔记本电脑上安装cuda8.0的过程和经验。 配置清单 硬件:惠普笔记本(GTX1050 ti) 系统:Ubuntu1 16.04.01 64位 常见安装方法: .run包(本地)、.deb包(本地)、deb(在线)、集群(本地)。 建议:采用第一种方式。.run包里已经包含了显卡驱动、cuda tools、samples例子程序。理论上...

2017-04-10 20:34:00 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除