Kaldi三音素GMM学习笔记

最新推荐文章于 2024-06-09 18:26:29 发布

置顶

开拓的博客

最新推荐文章于 2024-06-09 18:26:29 发布

阅读量1w

点赞数 8

分类专栏： ASR Kaldi 文章标签： Kaldi ASR GMM 三音素声学模型

本文链接：https://blog.csdn.net/u010731824/article/details/70161677

版权

建议在csdn资源页中免费下载该学习笔记的PDF版进行阅读：）点击进入下载页面

Kaldi三音素GMM学习笔记

　　三音素GMM与单音素GMM的主要差别在于决策树状态绑定，与GMM参数更新相关的原理、程序和类两者都是一样的。
　　在这个笔记中，我会首先介绍表示HMM的类HmmTopology和TransitionModel，然后介绍三音素GMM训练脚本train_deltas.sh用到的几个程序，这几个程序与单音素GMM的不同或者只在三音素GMM训练中出现。与GMM相关的其余部分请参考单音素GMM学习笔记。

Kaldi三音素GMM学习笔记

HmmTopology

　　为什么要介绍HmmTopology（后简称HT）和TransitionModel（后简称TM）？前面我们几乎一直在讲GMM和决策树，那么HMM用什么表示？在Kaldi中用TM表示HMM，TM中包含一个HT对象，用来表示HMM拓扑结构。
　　在Kaldi数据准备阶段，Kaldi会在data/lang目录下自动生成表示HMM拓扑结构的文件topo，HT对象就保存topo中的信息。一是topo中都有哪些音素，保存在HT的数据成员phone_中；二是每个音素的HMM结构是什么，由HT的数据成员phone2idx_和entries_共同决定。我们用下面一个图来解构HmmTopology的数据成员。
这里写图片描述

TransitionModel

　　在单音素GMM初始化程序gmm-init-mono和三音素GMM初始化程序gmm-init-model中都会调用TM构造函数TransitionModel(const ContextDependencyInterface &ctx_dep, const HmmTopology &hmm_topo)来初始化TM。我们也就以此构造函数为切入口，来学习TransitionModel中各数据成员是怎么构造出来的。
　　我们先来看看TM都有哪些数据成员以及各自的作用：

  HmmTopology topo_;
  /// 由transition state – 1进行索引;

最低0.47元/天解锁文章

开拓的博客

关注

8
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
Kaldi三音素GMM学习笔记

在这个笔记中，我会首先介绍表示HMM的类HmmTopology和TransitionModel，然后介绍三音素GMM训练脚本train_deltas.sh用到的几个程序，这几个程序与单音素GMM的不同或者只在三音素GMM训练中出现。与GMM相关的其余部分请参考单音素GMM学习笔记。
复制链接

扫一扫