在单HMM模型参数估计的Baum-Welch算法中,使用硬边界,即使用模型对应音段的开始和结束时间。这里的嵌入式HMM模型参数估计Baum-Welch算法,忽略观察序列
对应的模型之间的边界,即使用所谓的软边界。训练时,将
对应的模型(假设有
个,
)按时间先后顺序拼接起来构成一个复合模型,模型与模型之间的转移概率为1.0。对这个复合模型整体使用Baum-Welch算法来达到重估
个子模型参数的目的。虽然这里使用的Baum-Welch算法还是经典的算法,但由于使用了复合模型,其形式和经典的相差甚远。
采用这样的训练方式,其好处主要有两个。第一,语音信号的音素切分问题本身就是个不平凡的问题,至今还没有一个准确(标准也不好定)的音素自动切分程序,使用嵌入式训练恰好避开了这个麻烦,模型在训练过程中自身会收敛到一个合适的边界。第二,只要给定一个合适的模型初始值,使用软边界训练,得到的模型参数将会更为精确和一致。事实上,利用嵌入式训练收敛的HMM参数,可以反过来完成音段的自动切分。这就避免了“鸡生蛋、蛋生鸡”的困扰。
2. 前后向算法
本节描述在嵌入式训练中前后向概率计算的公式,注意HTK中模型的特殊性,即开始和结束状态为非输出状态。并且
,
注意:
1.
拼接模型的第一个和最后一个模型不能是Tee模型(Tee模型是指存在从开始状态到结束状态的转移概率的HMM模型,即:
)
2. 拼接模型中不能出现相继的Tee模型。
前向概率
(上指标
为拼接模型中的模型标号,
,下同)
,
a. 初始条件,
,
即:
b. 递归计算,
推导
,
如下
又,
所以:
,
c. 终结
总的似然值:
后向概率
,
a. 初始条件
,
即:
b. 递归计算,
推导
如下:
而,
所以: