http://blog.csdn.net/u010731824/article/details/69668647
http://blog.csdn.net/u010731824/article/details/69667017
Tree-Based State Tying For High Accuracy Acoustic Modelling
决策树是对三音素的状态而非三音素自身进行聚类
决策树是至顶向下建立的,将为每个音素(HMM)的每个子音素(状态)建议一个决策树
举例:音素/ih/的第一个状态的决策树
将所有以/ih/为中心的三音素(一个大簇),作为树的根结点。对于树的每个结点,将结点对应的簇分为两个更小的簇(根据'问题'来划分)
Stop 中止音
Nasal 鼻音
Fricative 摩擦音
Liquid 流音
Vowel 元音
Front Vowel 前元音
Central Vowel 中央元音
Back Vowel 后元音
High Vowel 高元音
Rounded 浑元音
Reduced
Unvoiced 清音
Coronal 舌尖音
决策树的训练 build-tree
树从根结点开始训练,对树中的每个节点,该算法计算每一个可能的问题q的声学似然度(分裂后)。然后为该结点选择产生最大似然度的问题q并进行分裂。然后迭代这个过程(即树的生长过程),当每个叶子节点的三音素数量低于最小阈值时终止迭代。
由单高斯生成混合高斯 gmm-mixup
1,我们首先为每个绑定的三音素训练对应的单高斯。
2,对每个高斯(状态)进行复制,并适当地扰乱它们,然后对这些高斯进行多次EM迭代。
3,再次复制这这些高斯,并适当地扰乱它们并再次训练。
4,迭代2和3,直到每个混合高斯有足够数量的混元。