HMM经典介绍论文【Rabiner 1989】翻译(十七)——多观测序列

5.2 多观测序列

在第4节我们讨论了左右HMM(Bakis模型),这种模型中状态按序从 t=1 时的状态1移动到 tT 时的状态N。我们已经讨论了左右模型是怎么对状态转移矩阵施加约束的以及初始状态概率(45)-(48)。但是,左右模型的主要问题是不可能只用一个观测序列训练模型。这是因为模型中状态的瞬态性质允许状态被观察到有限几次,直到转移到后续状态。为了有足够的数据对模型参数进行可靠估计,我们必须使用多个观察序列。估计过程修改如下。我们定义 K 个观测序列为

O=[O1,O2,,OK](106)

其中 Ok=[Ok1Ok2OkTk] 是第 k 个观测序列。我们假设每个观测序列和其他所有的观测序列之间是独立的,并且我们的目的是调整模型参数λ以最大化

P(O|λ)=k=1KP(Ok|λ)=k=1KPk,(107)(108)

其中 Pk 是每个序列的概率,可以通过前向算法进行计算。

现在

γkt(i)=P(qkt=Si|O,λ)=P(qkt=Si|O,λ)=αkt(i)βkt(i)P(Ok|λ)=αkt(i)βkt(i)Pk

ξkt(i,j)=P(qkt=Si,qkt+1=Sj|O,λ)=P(qkt=Si,qkt+1=Sj|Ok,λ)=αkt(i)aijbj(Okt+1)βkt+1(j)P(Ok,λ)=αkt(i)aijbj(Okt+1)βkt+1(j)Pk

在参数估计表达式中,对单观测序列,分子分母中的 P(O|λ) 项可以被消掉;但是对于多观测序列是没法消掉的。

于是修改后的估计公式为

aij¯=Kk=1Tk1t=1ξkt(i,j)Kk=1Tk1t=1γkt(i)=Kk=11PkTk1t=1αkt(i)aijbj(Okt+1)βkt+1(j)Kk=11PkTk1t=1αkt(i)βkt(i)(109)

bj¯(l)=Kk=1Tkt=1,Okt=vlγkt(i)Kk=1Tkt=1γkt(i)=Kk=11PkTkt=1,Ot=vlαkt(i)βkt(i)Kk=11PkTkt=1αkt(i)βkt(i)(110)

πi 不需要重新估计,因为 π1=1,πi=0,i1

(109)-(110)在实际中是不可行的,因为我们没有进行放大。进行放大后的估计公式为:

aij¯=Kk=11PkTk1t=1[α^kt(i)aijbj(Okt+1)β^kt+1(j)]/CkTKk=11PkTk1t=1[α^kt(i)β^kt(i)]/(cktCkT)=Kk=1Tk1t=1α^kt(i)aijbj(Okt+1)β^kt+1(j)Kk=1Tk1t=1α^kt(i)β^kt(i)/ckt(111a)

里用到了 PkCkT=1 。通过放大, Pk 项也被消掉了。对 b¯j(l) 也有类似的结果。

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值