声学特征变换 STC/MLLT


背景

Global Semi-tied Covariance (STC)/Maximum Likelihood Linear Transform (MLLT) estimation
gmm建模方差使用对角矩阵的前提是假设特征之间相互独立,使用full或者block-diagonal矩阵可以对相关性的特征建模,但是参数增多。为了解决使用这个问题,有两种方法:

  • feature-space 使用DCT或者LDA去相关
  • model-space 不同的模型可以使用不同的转换,更灵活

semi-tied covariance matrices是model-space里面的一种形式,也是为了解决使用full covariance的参数量大的问题。相比于full covariance,这种方法的每个高斯分量有两个方差矩阵:

  1. diagonal covariance ∑ d i a g ( m ) \sum_{diag}^{(m)} diag(m)
  2. semi-tied class-dependent nondiagonal matrix H ( r ) H^{(r)} H(r),可以在多个高斯分量之间共享(比如所有monophone对用状态的高斯分量)。

最后的方差矩阵: ∑ ( m ) = H ( r ) ∑ d i a g ( m ) H ( r ) T \sum^{(m)}=H^{(r)}\sum_{diag}^{(m)}H^{(r)T} (m)=H(r)diag(m)H(r)T,使用最大似然估计结合EM算法求解对应的参数。
如果做变换 A ( r ) = H ( r ) − 1 A^{(r)}=H^{(r)-1} A(r)=H(r)1,把在分母上的semi-tied covariance转换到分子上面,也就是相当于特征 o ( τ ) o(\tau) o(τ)和均值 μ ( m ) \mu^{(m)} μ(m)同时乘以 A ( r ) A^{(r)} A(r),也就是对特征和gmm的均值同时做MLLT。

kaldi实现

steps/train_lda_mllt.sh
假设特征40维,得到的mllt转换矩阵是40*40,转换矩阵同时作用于gmm的均值和特征

参考

1.Semi-tied covariance matrices for hidden Markov models

后面的技术分享转移到微信公众号上面更新了,【欢迎扫码关注交流】

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值