hmm 流程图_[转载]HTK之嵌入式HMM模型参数估计Baum-Welch算法

在单HMM模型参数估计的Baum-Welch算法中,使用硬边界,即使用模型对应音段的开始和结束时间。这里的嵌入式HMM模型参数估计Baum-Welch算法,忽略观察序列对应的模型之间的边界,即使用所谓的软边界。训练时,将对应的模型(假设有个,)按时间先后顺序拼接起来构成一个复合模型,模型与模型之间的转移概率为1.0。对这个复合模型整体使用Baum-Welch算法来达到重估个子模型参数的目的。虽然这...
摘要由CSDN通过智能技术生成

在单HMM模型参数估计的Baum-Welch算法中,使用硬边界,即使用模型对应音段的开始和结束时间。这里的嵌入式HMM模型参数估计Baum-Welch算法,忽略观察序列

a4c26d1e5885305701be709a3d33442f.png对应的模型之间的边界,即使用所谓的软边界。训练时,将

a4c26d1e5885305701be709a3d33442f.png对应的模型(假设有

a4c26d1e5885305701be709a3d33442f.png个,

a4c26d1e5885305701be709a3d33442f.png)按时间先后顺序拼接起来构成一个复合模型,模型与模型之间的转移概率为1.0。对这个复合模型整体使用Baum-Welch算法来达到重估

a4c26d1e5885305701be709a3d33442f.png个子模型参数的目的。虽然这里使用的Baum-Welch算法还是经典的算法,但由于使用了复合模型,其形式和经典的相差甚远。

a4c26d1e5885305701be709a3d33442f.png

采用这样的训练方式,其好处主要有两个。第一,语音信号的音素切分问题本身就是个不平凡的问题,至今还没有一个准确(标准也不好定)的音素自动切分程序,使用嵌入式训练恰好避开了这个麻烦,模型在训练过程中自身会收敛到一个合适的边界。第二,只要给定一个合适的模型初始值,使用软边界训练,得到的模型参数将会更为精确和一致。事实上,利用嵌入式训练收敛的HMM参数,可以反过来完成音段的自动切分。这就避免了“鸡生蛋、蛋生鸡”的困扰。

2. 前后向算法

本节描述在嵌入式训练中前后向概率计算的公式,注意HTK中模型的特殊性,即开始和结束状态为非输出状态。并且

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

注意:

1.

拼接模型的第一个和最后一个模型不能是Tee模型(Tee模型是指存在从开始状态到结束状态的转移概率的HMM模型,即:

a4c26d1e5885305701be709a3d33442f.png)

2. 拼接模型中不能出现相继的Tee模型。

前向概率

a4c26d1e5885305701be709a3d33442f.png(上指标

a4c26d1e5885305701be709a3d33442f.png为拼接模型中的模型标号,

a4c26d1e5885305701be709a3d33442f.png,下同)

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a. 初始条件,

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

即:

a4c26d1e5885305701be709a3d33442f.png

b. 递归计算,

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

推导

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png如下

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

又,

a4c26d1e5885305701be709a3d33442f.png

所以:

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

c. 终结

总的似然值:

a4c26d1e5885305701be709a3d33442f.png

后向概率

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a. 初始条件

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

即:

a4c26d1e5885305701be709a3d33442f.png

b. 递归计算,

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png

推导

a4c26d1e5885305701be709a3d33442f.png如下:

a4c26d1e5885305701be709a3d33442f.png

而,

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png所以:

a4c26d1e5885305701be709a3d33442f.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值