上下文相关音素-决策树聚类

本文介绍了如何使用决策树聚类处理上下文相关音素(triphone),以解决KNN等数据驱动算法无法处理未在训练数据中出现的triphone问题。通过一系列步骤,包括初始化、EM算法迭代、状态绑定和决策树聚类,实现了从monophone到triphone的转换,并确保了模型的性能和泛化能力。
摘要由CSDN通过智能技术生成

上一篇主要讲了triphone 状态绑定的过程,本文主要讲triphone的决策树聚类过程。

基于data-driven的聚类算法,如KNN,有个缺点,就是无法处理训练数据中没有出现过的triphone,基于决策树的聚类可以解决这个问题。

基于决策树的聚类过程中,把任意一个phone分裂成2类,其log 似然必然会增加,因为分裂后同样的个数的数据,其参数增加一倍,因此,选择不同的question对phone集合进行分裂,使得分裂后的log 似然增加最大。具体描述如下:

1)初始所有的状态都在一个类别中,作为tree的root节点;

2)找到一个question,使得分裂后的2个类别的log 似然增加最大,把当前的question作为当前tree节点的问题;

3)从上到家重复这个过程,直到分裂后,增加的log 似然小于某个给定的阈值;

4)最后,对不同父亲节点的两个叶子节点的类别成一个类,计算其减少的log 似然是否小于给定的阈值,如果小于这个阈值,则合并,否则不合并。

其中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值